Microsoft позволяет GPT сотрудничать с Claude, превосходя всех конкурентов
Microsoft объявила в понедельник о выпуске двух новых функций для Copilot Researcher — Critique и Council — объединяющих GPT от OpenAI и Claude от Anthropic для выполнения одной и той же исследовательской задачи.
Критика использует последовательную модель сотрудничества: GPT отвечает за планирование исследований, поиск информации и создание первого черновика, в то время как Claude выступает в роли строгого рецензента, проверяющего точность фактов и качество цитат; Council позволяет обеим моделям независимо генерировать отчеты параллельно, при этом третья модель-референт сравнивает различия и обобщает расхождения.
В тесте по оценке DRACO, охватывающем 100 сложных исследовательских задач в 10 областях, включая здравоохранение, право и технологии, Copilot, оснащенный Critique, набрал 57,4 балла, опередив второе место почти на 14%, значительно превосходя Claude Opus, работающего в одиночку, с результатом 42,7 балла.
