IA Brasil Digital | Nova versão do Gemini do Google pode processar muito mais dados.

O Google DeepMind lan�ou a pr�xima gera��o de seu poderoso modelo de Intelig�ncia Artificial, Gemini, com capacidades aprimoradas para lidar com grandes quantidades de v�deo, texto e imagens. Este � um avan�o significativo em rela��o �s vers�es anteriores do Gemini 1.0, variando em tamanho e complexidade.

A nova vers�o, Gemini 1.5 Pro, est� dispon�vel para desenvolvedores e clientes corporativos selecionados. Embora seja um modelo de n�vel intermedi�rio, o Gemini 1.5 Pro oferece desempenho equivalente ao antigo Gemini 1.0 Ultra, mas com menor consumo de poder computacional.

Capacidade de processar entradas maiores

A principal melhoria � a capacidade de processar uma quantidade muito maior de dados de entrada. A vers�o padr�o do novo Gemini 1.5 Pro pode lidar com at� 128.000 tokens (palavras ou partes de palavras), alcan�ando o mesmo n�vel da melhor vers�o do GPT-4 (GPT-4 Turbo).

Essa capacidade resulta de avan�os na arquitetura de "mistura de especialistas", que divide a rede neural em partes e ativa apenas as relevantes para a tarefa, em vez de acionar toda a rede simultaneamente.

Demonstra��o com transcri��o da Apollo

Em uma demonstra��o, os pesquisadores alimentaram o Gemini com uma transcri��o de 402 p�ginas da miss�o de pouso na Lua da Apollo.

Posteriormente, mostraram um esbo�o de uma bota e pediram ao modelo que identificasse o momento na transcri��o que o desenho representava, o que ele conseguiu fazer com sucesso.

Essa capacidade de processar grandes quantidades de dados abre novas possibilidades para aplica��es de IA que exigem a an�lise de conjuntos de dados complexos e volumosos.