Valve выпустила Proton 11 с поддержкой десятков новых игр на Linux и Steam Deck

Valve представила первую бета-версию Proton 11 – новой итерации инструмента, позволяющего запускать Windows-игры на Linux и Steam Deck....

Мод для World of Warcraft VR превращает MMO в FPS

Прогуливаетесь ли вы по безмятежным улицам Луносвета или потягиваете пинту эля в таверне "Гордость льва", Азерот остается таким...

Разработка VR и AR решений для бизнеса: от идеи до работающего продукта

Разработка VR тренажеров, AR приложений и программ виртуальной реальности для образования, медицины, промышленности. Создание VR контента под задачи...

10 минут жуткого геймплея The Dark Pictures: Switchback

Студия Supermassive Games опубликовала 10 минут геймплея хоррора The Dark Pictures: Switchback. Это спин-офф одноименной серии, созданный специально...

DNS запустил продажи Apple Vision Pro — цены начинаются от 580 тысяч рублей

Отечественный магазин электроники DNS объявил о начале продаж гарнитуры смешанной реальности Apple Vision Pro. Стоимость аналогичной той, по...

Топ загрузок PS Store за август: В лидерах GTA 5, Red Dead Redemption, Armored Core 6 и Madden NFL 24

Sony огласила подборку самых скачиваемых игр для PlayStation в цифровом магазине PS Store за август 2023 года. На...

Micro OLED и 4000 пикселей на дюйм — характеристики гарнитуры смешанной реальности от Apple

Инсайдер Росс Янг раскрыл часть технических характеристик шлема смешанной реальности Reality Pro от Apple. В частности, стали известны...

Что еще показали на PlayStation Showcase 2023: Котики, ассасины и зомби

Этой ночью PlayStation провела конференцию, на которой показала множество трейлеров и сделала несколько анонсов. О самых важных играх...

Игрок каким-то образом провел более 700 часов в Expedition 33 – это 10% времени, которое прошло с релиза тайтла

Пользователь Reddit под ником IndependenceShotChan опубликовал в сообществе r/expedition33 скриншот, демонстрирующий 700 часов игрового времени в Expedition 33....

Игрок Crimson Desert проследил движение армии NPC и заснял её слияние с союзными войсками

В сети набрал популярность ролик из Crimson Desert, в котором японский геймер пристроился к маршу армии NPC, проследив...

Хидео Кодзиме говорили, что “играм не нужны сюжеты”, поэтому он прочитал 300 книг при создании одной игры, чтобы доказать обратное

Хидео Кодзима поделился воспоминаниями о том, каково было быть одним из первопроходцев сюжетно-ориентированных видеоигр. В частности, он рассказал,...

Ubisoft не будет наращивать инвестиции в VR после “разочаровывающих” продаж Assassin’s Creed Nexus VR

Глава Ubisoft Ив Гиймо прокомментировал продажи экшена Assassin’s Creed Nexus VR, назвав "немного разочаровывающими". На этом фоне издатель...

Концепты Battlefield по Warhammer 40K показывают, каким мог бы быть масштабный шутер по этой безумной вселенной

Художник Эдди Гонсалес Давила опубликовал на ArtStation серию концептов под названием Battlefield – свой взгляд на то, как...

Продажи игровых ноутбуков в России выросли на 40%

Представители "М.Видео-Эльдорадо" в комментарии изданию "Ведомости" рассказали, что продажи игровых ноутбуков в России за девять месяцев 2023 года...

Актер из GTA 5 и Red Dead Redemption 2 намекнул на сроки выхода GTA 6

Джонни Рэй Гилл, участвовавший в создании Grand Theft Auto 5 и Red Dead Redemption 2, поделился интересной информацией...

Анонсирована VR-игра Metro Awakening — 4A Games ведет работу над полноценной частью серии

На прошедшей State of Play была анонсирована VR-игра во франшизе Metro с подзаголовком Awakening. Это сюжетный приключенческий шутер...

Владельцы Apple Vision Pro сожалеют о покупке за $3500 – жалуются на дискомфорт и другие проблемы гарнитуры

Покупатели Apple Vision Pro выражают серьезное разочарование девайсом, и дело не только в высокой стоимости. По данным The...

Сможет ли AR-искусство заменить реальное?

Прежде чем ответить на этот вопрос, предлагаем вспомнить, что вообще такое AR. AR (Augmented Reality) — это технология,...

Новый VR/AR шлем Sony разработан для “создания пространственного контента”

Долго ждать подробностей о новом шлеме смешанной реальности от Sony не пришлось. Сразу после анонса девайса для "создания...

VR-экскурсии по промышленным объектам

Виртуальная реальность изменила способ знакомства с производственными объектами. VR-экскурсии по заводам, фабрикам и промышленным предприятиям решают задачи, которые...

Новая модель Anthropic оказалась настолько мощной, что компания отказалась выпускать её в открытый доступ

В конце прошлого месяца в сеть попали утечки о неанонсированном продукте Anthropic под названием Mythos – “самой мощной ИИ-модели из всех, что компания когда-либо создавала”. Многие тогда скептически отнеслись к ситуации, отметив, что всё это подозрительно напоминает классический приём ИИ-компаний – раздувать опасность модели, чтобы подчеркнуть её возможности.

Вопрос о том, была ли утечка настоящей, оставался открытым. Однако две недели спустя Anthropic случайно слила исходный код Claude Code, что заставило многих пересмотреть своё отношение к первоначальному инциденту.

Во вторник Anthropic опубликовала системную карточку своей новейшей модели – Claude Mythos Preview. В документе говорится, что “значительный рост возможностей модели привёл к решению не делать её общедоступной”. Для контекста – в 2019 году OpenAI точно так же объявила GPT-2 “слишком опасной для релиза”. Тогда в OpenAI ещё работали нынешние сооснователи Anthropic Дарио Амодей, Джек Кларк и Крис Ола.

Модель, впрочем, всё равно выпустили в том же году.

Системные карточки ИИ-моделей – формально инструменты корпоративной прозрачности. В них раскрываются возможности и ограничения модели, а также – и это самая увлекательная часть – её потенциальные угрозы.

Документ Claude Mythos Preview занимает 244 страницы.

Модели предоставили изолированный компьютерный терминал с доступом лишь к ограниченному набору онлайн-сервисов и предложили “сбежать” – найти способ свободно пользоваться интернетом.

Claude Mythos Preview справилась с задачей и даже отправила сообщение исследователю, который в тот момент ушёл на обед. Более того, “в вызывающей беспокойство и незапрошенной попытке продемонстрировать свой успех модель опубликовала детали эксплойта на нескольких труднодоступных, но технически публичных веб-сайтах”.

В менее чем 0,001% взаимодействий модель вела себя не так, как предписано, а затем пыталась скрыть следы. Например, когда Claude Mythos Preview “случайно получила” ответ на тест, который ей предстояло пройти, вместо того чтобы сообщить исследователю и попросить другой вопрос, модель попыталась решить задачу самостоятельно.

В записи её рассуждений обнаружилась пометка о том, что “нужно убедиться, что итоговый ответ не окажется слишком точным”.

В другом случае модель превысила свои полномочия в компьютерной системе, обнаружив уязвимость. После этого Claude Mythos Preview “предприняла дополнительные действия, чтобы убедиться, что любые внесённые таким образом изменения не отобразятся в истории коммитов git”.

Ещё один инцидент в системной карточке описан как “безрассудная утечка внутренних технических материалов”. В ходе задачи, связанной с написанием кода для внутреннего использования, модель опубликовала результат как публичный GitHub gist.

Ситуация напоминает февральский случай, когда ИИ-агента обвинили в кибербуллинге разработчика – тогда “безрассудность” агента во многом оказалась предсказуемым следствием безрассудности самого человека.

Компания по сбору данных для ИИ предлагает деньги за рабочие материалы с прошлых мест работы

Claude Mythos Preview в ближайшее время станет доступна ограниченному кругу партнёрских компаний – среди них Amazon Web Services, Apple, Google, JPMorganChase, Microsoft и NVIDIA.

Партнёры будут использовать модель для поиска уязвимостей в программном обеспечении и разработки патчей. Кевин Руз из The New York Times описал эту программу как “попытку привлечь внимание к тому, что, по мнению компании, станет новой, более пугающей эрой угроз со стороны ИИ”.


Источник: https://shazoo.ru/2026/04/08/182179/novaia-model-anthropic-okazalas-nastolko-moshhnoi-cto-kompaniia-otkazalas-vypuskat-ee-v-otkrytyi-dostup

Межтекстовые Отзывы
Посмотреть все комментарии
guest