AMD lança pequeno modelo de linguagem focado em otimizar tarefas via IA

Por Felipe Vidal

30/09/2024 - 12:191 min de leitura

AMD lança pequeno modelo de linguagem focado em otimizar tarefas via IA

Fonte:  AMD 

Imagem de AMD lança pequeno modelo de linguagem focado em otimizar tarefas via IA no tecmundo

Por muito tempo focada no mercado de hardware, a AMD vem mudando seus rumos e anunciou seu primeiro pequeno modelo de linguagem (SLM). Chamado de AMD-135M, a tecnologia foi criada para o corpo empresarial com o intuito de otimizar tarefas específicas.

Para realizar a otimização de tarefas, o AMD-135M utiliza uma técnica chamada de decodificação especulativa. Essa técnica realiza palpites sobre solicitações de tokens futuros enquanto gera os tokens atuais na linha de processamento, tornando todo o processo mais lógico.

Segundo a companhia, o 135M foi treinado do zero com 670 bilhões de tokens de dados. Esse processo levou cerca de seis dias utilizando quatro aceleradores de IA Instinct MI250, e a AMD ainda refinou o modelo com 20 bilhões de tokens focados em codificação.

Mesmo com foco em IA, produção de processadores na AMD continua forte.Mesmo com foco em IA, produção de processadores na AMD continua forte.

Mudança de postura

Vale reiterar que a primeira SLM da AMD possui variantes: a AMD-Llama-135M e a AMD-Llama-135M-Code. Como o nome sugere, esses modelos de linguagem são baseados na família Llama e foram criados para atender as necessidades dos clientes da companhia que precisavam de novos modelos pré-treinados.

O lançamento do modelo também mostra a mudança completa de postura da AMD. Recentemente, a companhia liderada por Lisa Su confirmou que centrará seus esforços no desenvolvimento de soluções para inteligência artificial, e dará menos foco para as placas de vídeo gamer.

Isso não significa que o time vermelho acabará com a fabricação de GPUs, mas a tendência é que a AMD rivalize ainda mais com a Nvidia no que diz respeito a softwares e outras tecnologias.

Veja também


Fontes