O lançamento do GPT-4 é iminente, como o CTO da Microsoft Alemanha, Andreas Braun, mencionou em um evento inicial de IA em 9 de março de 2023.

O GPT-4 está chegando na próxima semana: em um evento de informações híbridas de aproximadamente uma hora intitulado ” AI in Focus – Digital Kickoff ” em 9 de março de 2023, quatro funcionários da Microsoft Alemanha apresentaram Large Language Models (LLM) como a série GPT como uma força disruptiva para empresas e sua oferta Azure-OpenAI em detalhes. O evento inicial aconteceu em alemão, com a presença da agência de notícias Heise. De forma bastante casual, Andreas Braun, CTO da Microsoft Germany e Lead Data & AI STU, mencionou o que disse ser o lançamento iminente do GPT-4. O fato de a Microsoft estar ajustando a multimodalidade com OpenAI não deveria mais ser um segredo desde o lançamento do Kosmos-1 no início de março.

“Apresentaremos o GPT-4 na próxima semana”

“Apresentaremos o GPT-4 na próxima semana, teremos modelos multimodais que oferecerão possibilidades completamente diferentes – por exemplo, vídeos”, disse Braun. O CTO chamou o LLM de “mudança de jogo” porque ensina as máquinas a entender a linguagem natural, que então entendem de maneira estatística o que antes era legível e compreensível apenas por humanos. Nesse ínterim, a tecnologia avançou tanto que basicamente “funciona em todos os idiomas”: você pode fazer uma pergunta em alemão e obter uma resposta em italiano. Com a multimodalidade, a Microsoft (-OpenAI) “tornará os modelos abrangentes”.

Disrupção e “matando velhos queridinhos”

Braun foi acompanhado pela CEO da Microsoft Alemanha, Marianne Janik, que falou sobre a disrupção por meio da IA ​​nas empresas. Janik enfatizou o potencial de criação de valor da inteligência artificial e falou sobre um ponto de virada no tempo – o atual desenvolvimento de IA e o ChatGPT foram “um momento do iPhone”. Não se trata de substituir empregos, disse ela, mas de fazer tarefas repetitivas de uma maneira diferente de antes. Um ponto que muitas vezes é esquecido na discussão pública é que “nós na Alemanha ainda temos muito legado em nossas empresas” e “mantemos velhos tesouros vivos por anos”.

A Distupção não significa necessariamente perda de empregos. Serão necessários “muitos especialistas para fazer uso da agregação de valor da IA”, enfatizou Janik. As descrições de trabalho tradicionais estão mudando e novas profissões empolgantes estão surgindo como resultado do enriquecimento com as novas possibilidades. Ela recomenda que as empresas formem “centros de competência” internos que possam treinar funcionários no uso da IA ​​e agrupar ideias para projetos. Ao fazê-lo, “a migração de velhos queridos deve ser considerada”.

Além disso, a CEO enfatizou que a Microsoft não usa os dados dos clientes para treinar modelos (o que, no entanto, não se aplica ou não se aplicava pelo menos ao seu parceiro de pesquisa OpenAI de acordo com a política do ChatGPT). Janik falava de uma “democratização” – com a qual se referia apenas à usabilidade imediata dos modelos no âmbito da gama de produtos Microsoft, nomeadamente a sua ampla disponibilidade através da integração de IA na plataforma Azure, Outlook e Teams.

Casos de uso que já são possíveis hoje

Clemens Sieber (Especialista Sênior em IA) e Holger Kenn (Tecnólogo Chefe de Desenvolvimento de Negócios IA e Tecnologias Emergentes, ambos Microsoft Alemanha) forneceram informações sobre o uso prático de IA e casos de uso concretos nos quais suas equipes estão trabalhando atualmente, mas também sobre experiências técnicas. Kenn explicou do que se trata a IA multimodal, que pode traduzir texto não apenas em imagens, mas também em música e vídeo. Ele falou sobre embeddings, que são usados ​​para a representação interna do texto no modelo, além da classe do modelo GPT-3.5. A IA responsável já está incorporada aos produtos da Microsoft, de acordo com Kenn, e “milhões de consultas podem ser mapeadas nas APIs” por meio da nuvem. A maioria do público provavelmente concordou com ele em uma avaliação básica, que agora é a hora de começar. Principalmente na área de programação, Clemens Siebler ilustrou com casos de uso o que já é possível hoje. Por exemplo, chamadas telefônicas de fala para texto poderiam ser gravadas e os agentes de um call center não precisariam mais resumir e digitar manualmente o conteúdo. Segundo Siebler, isso poderia economizar 500 horas de trabalho por dia para um grande cliente da Microsoft na Holanda, que recebe 30.000 chamadas por dia. E o protótipo do projeto foi criado em duas horas, um único desenvolvedor implementou o projeto em quinze dias (mais tempo para a implementação final). Segundo ele, os três casos de uso mais comuns são responder a perguntas sobre o conhecimento da empresa acessível apenas aos funcionários, processamento de documentos assistido por IA e semiautomação por processamento de linguagem falada na central de atendimento e resposta.

Questionado sobre confiabilidade operacional e fidelidade de fatos, Siebler disse que nem sempre a IA responderá corretamente, por isso é preciso validar. A Microsoft está atualmente criando métricas de confiança para resolver esse problema. Os clientes costumam usar o suporte de IA apenas em seus próprios conjuntos de dados, principalmente para compreensão de leitura e consulta de dados de inventário, onde os modelos já são bastante precisos. No entanto, o texto gerado pelo modelo permanece generativo e, portanto, não é facilmente verificável. “Construímos um ciclo de feedback em torno disso com polegares para cima e polegares para baixo”, disse Siebler – este é um processo iterativo. Curiosamente, nenhum dos quatro funcionários da Microsoft comentou sobre a integração da IA ​​no próprio mecanismo de busca da empresa, “o novo Bing”. O painel final não foi aberto a perguntas do público.

Fonte: GPT-4 is coming next week – and it will be multimodal, says Microsoft Germany | heise online