13 мая по местному времени OpenAI провела весеннюю пресс-конференцию, в которой было объявлено, что будет представлена настольная версия ChatGPT, а также новая модель флагмана AI GPT-4o. Согласно официальному сайту OpenAI, “o” в GPT-4o означает омни, то есть “всемогущий”. GPT-4o текстов, рассуждений и возможностей кодирования достигающих уровня GPT-4 Turbo в два раза быстрее, чем предыдущее поколение моделей GPT-4 Turbo, но стоит в два раза меньше, чем предыдущая модель GPT-4 Turbo. GPT-4o быстрее и обладает способностью распознавать эмоции пользователей в соответствии с OpenAI, где GPT-4o отличается от механизмов голосовой беседы GPT-3.5 и GPT-4. GPT-3.5 и GPT-4 сначала преобразуют звук в текст, а затем получают текстовое сообщение, и в конечном счете преобразуют текст в аудиозапись, в результате чего такая информация, как эмоциональная экспрессия в аудио, будет искажена, и GPT-4o будет первой в истории моделью, которая объединит эти измерения, Так будет лучше для беседы. «Это первый большой шаг, который мы действительно делаем в плане доступности», — говорит глава технологии OpenAI мира мурати. Исследователь OpenAI Марк чен заявил, что новая модель обладает способностью «чувствовать эмоции», которая может экспортировать смех, пение или выражать эмоции, и что она может справиться с ситуацией, когда ее прерывает пользователь. GPT-4o значительно улучшил опыт общения с роботами чата в OpenAI. На пресс-конференции руководитель исследований OpenAI Марк чен и руководитель последующей тренировочной группы OpenAI Barret Zoph продемонстрировали силу новой модели GPT-4o в живую. Например, во время презентации Марк чен вел себя немного нервно, а потом начал задыхаться. Когда GPT-4o слышит, как чен выдыхает слишком много, он, кажется, улавливает его напряжение и говорит: «расслабься, ты дышишь как пылесос, дыши глубже и выдыхай снова». Затем GPT начал указывать чену, как глубоко вдохнуть и успокоиться. В другой диалоге чен просит GPT рассказать Zoph сказку на ночь, которую тот неоднократно прерывает, чтобы спросить, может ли GPT рассказать что-то более захватывающее, и в конце концов GPT поет историю в очень диснеевской манере. GPT-4o также может распознавать эмоции людей через визуальное распознавание. В одной из демонстраций Zoph поднёс телефон к своему лицу и попросил ChatGPT рассказать ему, как он выглядит. GPT-4o заметил улыбку на лице Zoph и сказал ему: «похоже, вы чувствуете себя очень счастливым и улыбающимся». GPT-4o также может быстро переводить в реальном времени в реальном времени, когда мира мурати, технический руководитель OpenAI, говорила на итальянском языке с ChatGPT в прямом эфире, в то время как GPT переводила ее слова на английский. Сэм альтман, генеральный директор OpenAI, сказал, что новые голосовые и видеомодели являются лучшими компьютерными интерфейсами, которые он когда-либо использовал, чувствуя себя как ии в кино. Время реакции и экспрессия на человеческом уровне сильно изменились. Сэм альтман сказал: «для меня никогда не было естественным разговаривать с компьютером, и теперь это так. По мере того как мы увеличиваем (выборочные) персонализацию, доступ к вашей информации, возможность действовать от вашего имени и т.д., я действительно вижу захватывающее будущее, в котором мы можем использовать компьютеры для того, чтобы делать больше, чем когда-либо». В будущем функции GPT-4o будут развиваться дальше, поскольку GPT-4o может использоваться в бесплатных версиях ChatGPT, а также в связи с вышестоящими ChatGPT Plus и Team, которые поставляют OpenAI, имеют ограничения на информацию «в пять раз выше». OpenAI отмечает, что когда пользователи достигают предела скорости, ChatGPT автоматически переключается на GPT-3.5. OpenAI утверждает, что ChatGPT текст и возможность ввода изображений, основанные на GPT-4o, будут запущены в понедельник, а голосовые и видео возможности будут доступны в течение следующих нескольких недель. Кроме того, OpenAI будет запущен пользователям Plus в течение следующего месяца с улучшением голосового опыта на основе GPT-4o, в настоящее время API GPT-4o не содержит функции голоса. OpenAI отмечает, что в отношении использования API цены на GPT-4-turbo, выпущенные в ноябре прошлого года, упали вдвое. Снижение стоимости имеет решающее значение для вызова большой модели. OpenAI начал работать над тем, чтобы вывести большие модели на рынок. Кроме того, согласно мурати, функции GPT-4o будут развиваться в будущем. Например, несмотря на то, что в настоящее время GPT-4o может просматривать фотографии меню на различных языках и переводить их, в будущем эта модель может позволить ChatGPT смотреть в прямом эфире спортивные соревнования и объяснять вам правила. «Мы знаем, что эти модели становятся все более сложными, но мы хотим, чтобы опыт взаимодействия стал более естественным и простым, и чтобы вы сосредоточились не на UI, а на сотрудничестве с ChatGPT», — говорит мурати. В отношении безопасности, к которой вы так долго обращали внимание, опнай также обратил особое внимание. Предполагается, что GPT-4o, с помощью фильтрации данных о тренировках и усовершенствования методов поведения моделей после обучения, встраивает в конструкцию межшаблоновую систему безопасности и создает новые системы безопасности, которые создают барьеры для вывода голоса. GPT-4o также активно сотрудничают с более чем 70 сторонними экспертами в таких областях, как социальная психология, предубеждение и справедливость, ложная информация и т.д. OpenAI заявил, что риск новых открытий будет продолжать уменьшаться. Поскольк призна адресац-пот модел ауд различн нов риск, публичн в настоя врем-лиш текст и обрывк ввод и текст на выход, в в ближайш нескольк недел и нескольк месяц будут вокруг техническ инфраструктур, доступн посл тренировк, опубликова друг работа безопасн, необходим для модел, например ауд выходн ограничива отдельн пресет звуков, И будет следовать существующей политике безопасности. В заключение следует отметить, что большие технологии моделей быстро развиваются, в то время как новая модель OpenAI GPT-4o, несомненно, поднимает большие технологии и применения моделей на новый уровень. В настоящее время ведущие компании по глобальным технологиям активно борются за то, чтобы microsoft, google и другие ведущие компании создавали пресс-конференции, чтобы интенсивно продвигать большие модели продукции, и apple, по слухам, заключала сделку с OpenAI по использованию технологии в iPhone. Нетрудно заметить, что следующие большие модели, как в технологической модернизации, так и в применении к земле, предстанут в новом виде.

9200-01-01-10-00
Leave a comment
Your email address will not be published. Required fields are marked *