Как стартап Springboards борется с группмышлением больших языковых моделей

Как стартап Springboards борется с группмышлением больших языковых моделей

Большие языковые модели вроде Claude, ChatGPT и Gemini закреплены в предсказуемых паттернах ответов. Попробуйте попросить у любого такого чатбота случайное число между 1 и 10, в подавляющем большинстве случаев вы получите 7. Это не ошибка; это результат того, как модели обучены. Такая предсказуемость приемлема для задач вроде кодирования или научных поисков, но становится проблемой, когда нужно творчество: мозговой штурм, планирование отпуска, поиск нестандартных решений. Австралийский стартап Springboards заметил эту проблему и создал свою LLM под названием Flint. Её специально обучили выдавать более разнообразные ответы на открытые вопросы, например, на запрос "Куда мне поехать в Европу?" Flint рекомендует множество разных вариантов вместо «очевидного» маршрута. По сути, Springboards пытается отвести языковые модели от коридора группмышления и вернуть им творческий потенциал.

Ключевые факты

  • LLM типа Claude, ChatGPT и Gemini выдают одинаковые, предсказуемые ответы на одни и те же вопросы
  • При просьбе назвать случайное число от 1 до 10 почти все отвечают 7, это демонстрирует масштаб проблемы предсказуемости
  • Группмышление LLM, не баг, а результат обучения, но оно мешает творческим задачам вроде брейнштормов и планирования
  • Springboards создала LLM Flint, обученную генерировать более разнообразные и творческие ответы на открытые вопросы
  • Flint нацелена на задачи, где нужны нестандартные решения, а не оптимальный правильный ответ

Почему это важно

Языковые модели заняли центральное место в профессиональном и личном использовании, от кодирования до творчества. Но их естественная предвзятость к предсказуемым, «обычным» ответам тормозит инновации и творчество. Когда все LLM на одной и той же волне, мы теряем возможность получить свежую идею или нестандартное решение. Проблема становится критичной именно там, где нужно дивергентное мышление, а не конвергентное.

Кому это важно

Прежде всего, тем, кто использует LLM для творческих задач: дизайнерам, маркетологам, сценаристам, стратегам. Разработчикам, которым нужны новые идеи для фич и архитектур. Менеджерам, планирующим стратегию. Любому, кто задаёт открытые вопросы и хочет услышать несколько разных точек зрения, а не одну «примерно верную». Также важна для создателей AI-систем, которые хотят избежать эффекта группмышления в своих решениях.

Как это применить

Если вам нужно творчество от LLM, попробуйте Flint вместо mainstream-моделей для брейнштормов, планирования, поиска идей. Flint работает лучше всего на открытых вопросах, где нет одного правильного ответа. Для задач, требующих конкретности и надёжности (кодирование, расчёты, точный поиск информации), лучше остаться с привычными моделями, они проверены и стабильны. Можно комбинировать: используйте Flint для генерации идей, затем уточняйте с помощью основных моделей.

Можно ли доверять

Проблема предсказуемости LLM хорошо документирована в научной литературе и давно известна экспертам. Стартап Springboards затронул реальную боль. Однако Flint, молодой продукт, и мы не видим долгосрочные данные о её надёжности на сложных задачах. Вероятно, разнообразие ответов не всегда означает их качество. Нужно проверять Flint самостоятельно для своих конкретных сценариев прежде чем полагаться на неё полностью.

Риски и подводные камни

Flint, новая модель с небольшой историей использования, и трудно предсказать, как она поведёт себя на нестандартных входах. Стремление к разнообразию ответов может привести к более частым ошибкам и галлюцинациям, чем у стабильных mainstream-моделей. Творчество и надёжность часто антагонистичны, модель, которая думает по-новому, может думать и неправильно. Есть риск, что компании начнут полагаться на Flint для задач, где нужна точность, и получат результаты хуже, чем от проверенных моделей.

«Откройте свой любимый чатбот, Claude, ChatGPT, Gemini, и напишите: «Дайте мне случайное число от 1 до 10». Вы получите 7. Почти всегда.»

— Will Douglas Heaven, MIT Technology Review