Важно

  •  

Saturday, December 21, 2024

o3 - wow (English, Russian)



Из перевода транскрипта ролика:
Настоящая новость сегодняшнего вечера – это не то, что O3 сокрушила контрольные показатели, рассчитанные на десятилетия. Дело в том, что OpenAI продемонстрировали: любые задачи, которые можно измерить, серия моделей O в конечном итоге сможет превзойти. Позвольте мне пригласить вас подумать о любой задаче – если эта задача поддается логическому рассуждению и если шаги рассуждения представлены в данных для обучения, серия моделей O в конечном итоге сокрушит эту задачу. Да, возможно, O3 или OpenAI стоило 350 тысяч долларов времени на вычисления, чтобы превзойти некоторые из этих контрольных показателей, но одни лишь затраты не смогут долго сдерживать этот натиск. Да, я скажу оговорки, как всегда, и их довольно много, но я должен признать и признаю, что это знаменательный день в сфере ИИ, и практически все слушающие должны скорректировать свои прогнозы.

Прежде чем мы перейдем к абсолютно невероятным результатам тестов, давайте разберемся, что такое O3 и что они сделали. Я уже давал больше деталей о серии моделей O в предыдущих видео на этом канале, но позвольте мне дать вам краткое 30-секундное резюме. Искусственный интеллект заставляет базовую модель генерировать сотни или потенциально тысячи вариантов решений, следуя длинным цепочкам размышлений для получения ответа. Затем модель-проверяющий, вероятно, основанная на той же базовой модели, проверяет эти ответы и ранжирует их, выявляя классические ошибки вычислений или ошибки в рассуждениях. Эта модель-проверяющий, конечно, обучена на тысячах правильных шагов рассуждения. Но вот в чем суть: в научных областях, таких как математика и программирование, можно точно знать, какой ответ правильный. Поэтому, когда система генерирует правильный набор шагов рассуждения, приводящих к верному проверенному ответу, модель в целом может быть дообучена на этих корректных шагах. Это в корне меняет подход от предсказания следующего слова к предсказанию последовательности токенов, ведущих к объективно правильному ответу. Это дообучение на правильных ответах можно классифицировать как обучение с подкреплением. Так что же такое O3? Ну, это больше того же самого...


Ниже есть продолжение.

...Вот что сказал еще один ведущий исследователь OpenAI: «O3 очень эффективна, и что важнее, прогресс от O1 до O3 занял всего 3 месяца, что показывает, насколько быстро будет развиваться новый подход обучения с подкреплением». На основе цепочек размышлений влияние вычислений может масштабироваться намного быстрее, чем при предварительном обучении новой модели каждые 1-2 года. Возможно, мы никогда не увидим GPT-5, но получим ИИ общего назначения (AGI) в любом случае. Конечно, тестирование безопасности, вероятно, задержит выпуск этих новых поколений моделей для широкой публики, и в результате может возникнуть все более широкий разрыв между тем, что доступно в ведущих лабораториях, и тем, что доступно публике.

Наконец, Arc AGI. Важность O3 в том, что каждый пример – это новая задача, не встречавшаяся в тренировочных данных. Победа над этим тестом требует рассуждения. Arc AGI требует нахождения эффективных функций, что является ключевым элементом интеллекта. O3 достигла 88% в Arc AGI, используя вычисления на 350 тысяч долларов. Это не просто грубая сила – такие возможности требуют научного внимания. Модель доказала способность адаптироваться к новым задачам, опираясь на цепочки размышлений...

...Это приводит нас к важному вопросу – что считать AGI? Считается ли, что AGI ещё не достигнут, если всё ещё существуют бенчмарки, на которых средний человек превосходит модель? На данный момент Шолле не считает O3 ИИ уровня AGI. Причина в том, что всё ещё можно создавать новые, не освоенные модели, интересные бенчмарки, которые легко решаются людьми, но невозможны для ИИ без специализированных знаний.

AGI будет достигнут, когда создание таких тестов станет полностью невозможным. Вопрос: является ли это справедливым критерием? Должно ли быть невозможно создать такой бенчмарк, который легко решают люди, но не может решить ИИ? Или AGI следует определять по тому, насколько сложнее создавать такие тесты, которые легче для людей, чем для ИИ?

Кажется, это более справедливое определение – чтобы не оставалось единственного бенчмарка, который остаётся непокорённым, и из-за этого мы всё ещё говорим, что AGI не достигнут. Это оставляет открытым вопрос: труднее ли создать бенчмарк, который O3 не может решить, но легко решают люди? Рассматриваются ли разные модальности? Может ли ИИ определить отсутствие реализма в сгенерированных видео? Какие бенчмарки допустимы, а какие – нет? Что насчёт тестов, где учитывается скорость решения задач?



OpenAI заявляет, что мы достигли уровень сильного искусственного интеллекта (English, Russian)

AGI ACHIEVED | OpenAI Drops the BOMBSHELL that ARC AGI is beat by the o3 model



В тесте ARC-AGI, который оценивает способность ИИ выходить за пределы обучающих данных, o3 показала результат в 87,5%, что выше «человеческого уровня» (85%).

https://www.comss.ru/page.php?id=15360

OpenAI makes the remarkable claim that o3, at least in certain conditions, approaches AGI — with significant caveats...“[E]arly data points suggest that the upcoming [successor to the ARC-AGI] benchmark will still pose a significant challenge to o3, potentially reducing its score to under 30% even at high compute (while a smart human would still be able to score over 95% with no training),” Chollet continued in a statement. “You’ll know AGI is here when the exercise of creating tasks that are easy for regular humans but hard for AI becomes simply impossible.”


https://techcrunch.com/2024/12/20/openai-announces-new-o3-model/

Из перевода транскрипта ролика.
Думаю, будет трудно отрицать это в будущем. 20 декабря 2024 года OpenAI объявила о AGI на прямой трансляции. Все тесты и бенчмарки, которые использовались до этого момента, чтобы измерить, насколько умны эти модели, сравнивали способности моделей с человеческими. Например, Arc AGI показал 85% от уровня человеческой производительности. Они говорили, что если какая-либо модель наберет больше 85%, это будет свидетельствовать о том, что мы имеем дело с AGI — искусственным общим интеллектом. Модель набрала 88% на соревнованиях по программированию, таких как Codeforces. Якоб, главный научный сотрудник OpenAI, набрал 2727 очков в этом соревновании. В математических соревнованиях AIM 2024 модель показала 96,7%. У нас были люди с идеальными результатами, но даже они иногда могли допустить одну ошибку или упустить одну деталь. Однако модель почти идеальна. На вопросы уровня PhD по науке, в тесте GPQA, средний эксперт в этой области набирает 70%, а модель O3 показала 87,7%.

Ниже есть продолжение.

Большинство этих бенчмарков, где мы сравниваем модели с человеческими результатами, практически исчерпаны. Эти модели уже не просто умнее среднего человека — они умнее самых умных людей...

...Вот Франсуа Шоле — человек, стоящий за премией ARC AGI и один из первопроходцев в этой области, который придумал эту идею. Он бывший сотрудник Google, и его идея была проста: есть множество вещей, которые могут делать крупные языковые модели, нейросети и ИИ, но является ли это настоящим интеллектом? Это интеллект, как у человека? Является ли он общим? Многие из этих моделей могут обыгрывать людей в шахматы или го, но это запоминание, высокая вычислительная способность или общий интеллект, подобный человеческому?

Суть ARC AGI Benchmark заключалась в создании вопросов, которые были бы легкими для людей, но практически невозможными для того, кто просто запоминает и воспроизводит информацию. В этом процессе есть множество нюансов, чтобы убедиться, что модель не просто запоминает. Мы уже это обсуждали. Смысл в том, что ARC Benchmark был специально создан для того, чтобы «сломать» нейросети, и он делал это весьма эффективно. Лишь немногие модели могли набрать даже близкие к человеческим результаты.

Вот его пост в ответ на объявление OpenAI о модели O3...Он пишет: сегодня OpenAI объявила о модели O3 — новой модели рассуждений следующего поколения. Мы работали с OpenAI, чтобы протестировать ее на ARC, и считаем, что это значительный прорыв в адаптации ИИ к новым задачам. Модель набирает 75,7% в полуприватном режиме с низким уровнем вычислений, где соблюдается лимит в 10 000 долларов, и 87,5% в режиме с высоким уровнем вычислений, где на задачу тратится тысячи долларов. Мы думаем, что это более 300 тысяч долларов за весь тест.

...Премия ARC AGI была создана, чтобы поставить в тупик эти нейронные сети, заставляя их действительно рассуждать над задачами, не полагаясь на данные и запоминание. Иными словами, могла ли модель решить новые задачи, которых она раньше не видела, а также задачи, которые невозможно решить методом грубой силы, например, в шахматах, перебрав миллионы вариантов ходов. У нас уже есть суперинтеллект для шахмат и для игры го, но у нас нет суперинтеллекта, который является общим. До сих пор мы сомневались, есть ли у нас вообще искусственный интеллект, который равен людям.

Здесь он говорит: да, это очень дорого. Те 87,5%, вероятно, стоят сотни тысяч долларов на розничном рынке. Конечно, OpenAI, возможно, обходится это дешевле, но все равно это очень дорого. Однако, это не просто грубая сила. Он говорит, что эти способности открывают новую территорию. Это очень важно понять – это новая территория, и она требует серьезного научного внимания. Обратите внимание, что сам человек, который стоял за созданием ARC, говорит, что это новая территория. Президент ARC говорит, что нам всем нужно переосмыслить наши представления о том, как работает ИИ и на что он способен. Это не люди, которые всегда так думали. Это очень умные и знающие люди, которые корректируют свое мировоззрение. Они смотрят на эти результаты и говорят: «Хм, это что-то новое»...

...20 декабря 2024 года мы достигли какого-то рубежа. Конечно, найдутся люди, которые скажут, что это не AGI, и у нас нет единого определения AGI. Как недавно сказал Сэм Альтман, это, вероятно, не какой-то порог, который мы пересекаем, а скорее постепенный процесс. Но это веха на этом пути. Как бы там ни было, кажется, что мы прошли какую-то точку. Готовы ли вы назвать это AGI или нет – лично я думаю, что сегодняшний день можно назвать «Днем AGI».

Школьников: Необходимо научиться смотреть на мир глазами других культур, но при этом не терять себя

Форматирование моё.

...Можно отметить успешное прохождение условного «первого кризиса», когда индивид понимает и принимает, что существует множество различных позиций и точек зрения и все они могут быть правильными. К сожалению, большая часть публичных экспертов оказываются неспособны к этому шагу. Точнее, востребованы не перешагнувшие барьер, так как своей уверенностью они привлекают незрелую аудиторию.

"Второй кризис" случается за 40 лет - приходит понимание, что среди множества правильных позиций твоей может не быть. Приходит понимание трёх законов термодинамики и универсальности теоремы Гинзберга: "Ты не можешь выиграть. Ты не можешь сыграть вничью. Ты не можешь даже выйти из игры". Звучит всё довольно просто, но реально осознать и отстраниться, перейти в позицию наблюдателя, не так и просто. В качестве варианта – стратегическая позиция, умение мыслить и стратегировать за совершенно различные культуры. Необходимо научиться смотреть на мир глазами арабов, китайцев, безродных космополитов и т.д., но при этом не терять себя, оставаться самим собой.

После этого перехода многие нелогичные действия, парадоксы и будущие поступки геополитических игроков становятся понятны, рациональны и просты. Для примера, многие вопросы относительно действий и поведения Запада хорошо раскрываются через присущий их элитам дуализм, секулярный гностицизм и ощущение себя хозяевами игрового сервера. Европоцентристский взгляд на мир полностью пропитал современные общественные науки, об этом нужно помнить и учитывать, внося поправки. В общем и целом, пути становления ученым-универсалом могут быть разными... сбиться с пути.
https://t.me/geostrategrus/4129

Рон Бен Ишай: почему ЦАХАЛ не перехватил ракету из Йемена (Russian, Hebrew)

סכנת ראשי הקרב המתמרנים של הטילים האיראניים הכבדים וארוכי-הטווח תגדל לממדים קיומיים מנקודת ראייתה של ישראל, אם וכאשר איראן תצליח לפתח ראש קרב גרעיני לטילים האלו. מספיק שראש קרב גרעיני-מתמרן אחד יחדור את מערך ההגנה האווירית שלנו כדי לגרום אבידות והרס בממדים עצומים.



С точки зрения Израиля, опасность иранских маневрирующих боеголовок для тяжелых ракет дальнего радиуса действия может перерасти в экзистенциальную угрозу, если Ирану удастся установить на такие ракеты ядерные боеголовки. Достаточно чтобы одна маневрирующая ядерная боеголовка пробила нашу систему ПВО, чтобы вызвать потери и разрушения огромных масштабов...

...Может быть несколько причин, по которым ПВО Израиля не смогли перехватить баллистическую ракету, выпущенную из Йемена ночью в субботу, 21 декабря...


Ниже есть продолжение.

Боеголовка любой баллистической ракеты гиперзвуковая. После проникновения ракеты в атмосферу, она осуществляет маневрирование при помощи небольших ракетных двигателей, которые установлены в ее боеголовке и/или крыльях. Такой маневр может затруднить работу системы ПВО, так как боеголовка ракеты движется со скоростью 5 махов (в 5 раз превышающей скорость звука). Это также объясняет, почему боеголовка ракеты, запущенной в ночь на 19 декабря, попала в здание в Рамат-Эфале.

Известно, что у иранцев имеются ракеты с маневренными боеголовками, некоторые из которых, согласно информации из зарубежных СМИ, поразили во время иранской атаки авиабазы Тель-Ноф и Неватим. Похоже, что иранцы совместно с хуситами разработали метод запуска этих ракет по низкой баллистической траектории, что затрудняет их перехват.

Теперь возникает вопрос, почему ни один из слоев израильской воздушной обороны не смог поразить боеголовку? Возможно, из-за позднего обнаружения из-за низкого полета, затруднившего активацию всех имеющихся систем ПВО.

С точки зрения Израиля, опасность иранских маневрирующих боеголовок для тяжелых ракет дальнего радиуса действия может перерасти в экзистенциальную угрозу, если Ирану удастся установить на такие ракеты ядерные боеголовки. Достаточно чтобы одна маневрирующая ядерная боеголовка пробила нашу систему ПВО, чтобы вызвать потери и разрушения огромных масштабов. Таким прогнозом завершает Бен-Ишай свой материал.

В армии подтвердили, что попытки перехвата йеменской ракеты (по заявлению хуситов, применялась гиперзвуковая "Палестина-2") предпринимались, по цели были выпущены несколько перехватчиков. Из публикаций в СМИ можно понять, что таких попыток было две, а задействована была система ПРО "Хец", непосредственно предназначенная для нейтрализации баллистики.

Бригадный генерал (запаса) Дорон Гавиш, занимавший пост командующего системой противовоздушной обороны, отметил, что за время войны хуситы выпустили по Израилю около 15 баллистических ракет, большинство из которых были успешно перехвачены. По словам эксперта, при перехвате баллистической ракеты возможны три сценария: полный перехват, частичный перехват или отсутствие перехвата.

"Частичный перехват означает, что ракета-перехватчик поразила цель, но ее обломки, включая боеголовку, все же достигли земли. Иногда частичный перехват предотвращает попадание ракеты в запланированную цель, но бывают случаи, когда боеголовка падает в населенный район. Это, конечно, неудачный результат", - пояснил он.

https://www.ynet.co.il/news/article/hkrxdr7b1e

https://www.vesty.co.il/main/article/s1ibwmnbyx

Израиль включился в глобальную гонку за "квантовое превосходство"

Израиль представил свой первый квантовый компьютер и включился в глобальную гонку за "квантовое превосходство". Израильский 20-кубитный компьютер использует современную сверхпроводящую технологию.

"Квантовое превосходство" – это такой уровень производительности квантового компьютера, который обеспечивает решение задач, требующих практически недостижимой мощности конвенциональных суперкомпьютеров. На сегодня квантовое превосходство достигается только на некоторых модельных задачах несколькими квантовыми компьютерами, но развитие квантовых вычислений идет во всем мире. В этом глобальном соревновании принимают участие все развитые страны, но лидерами являются США и Китай. Теперь к этой гонке присоединяется Израиль.


Ниже есть продолжение.

Развитие квантовых вычислений включает в себя не только создание квантовых компьютеров, но и создание инфраструктуры доступа к вычислительным мощностям, разработку программного обеспечения и возможностей использования квантовых компьютеров совместно с конвенциональными суперкомпьютерами.

Израильский компьютер разработан под руководством концерна Авиационная промышленность Израиля (IAI) в сотрудничестве с Израильским управлением инноваций (IIA), Еврейским университетом Иерусалима и компанией Yissum.

IAI вкладывает значительные средства в то, чтобы Израиль стал ведущей страной в области квантовых вычислений. Лаборатория квантовых компьютеров IAI сосредоточится на разработке, моделировании, интеграции и адаптации практических приложений для нового квантового компьютера, сообщает Israel21c.

Деятельность лаборатории будет включать сотрудничество с компаниями и исследовательскими институтами по всему миру.

Генеральный директор IAI Боаз Леви заявил: "Квантовые технологии должны кардинально расширить возможности человека в самых разных областях; в последние годы IAI развивает инициативы в области робототехники, автономных систем, кибербезопасности и искусственного интеллекта, интегрируя их в наши бизнес-направления, в том числе в сотрудничестве со стартапами и научными кругами. Чтобы победить на будущих полях сражений, Израилю нужны передовые технологии".

Дрор Бин, глава IIA, добавил: "Презентация первого израильского квантового компьютера – важная веха. Это не единичная инициатива, а часть широкой стратегии по продвижению прорывных технологий в различных областях. Все эти усилия являются частью общенационального стратегического плана развития квантовых вычислений, направленного на поддержание технологического лидерства Израиля, сохранение конкурентоспособности израильской высокотехнологичной промышленности и обеспечение устойчивого экономического роста"...



Французский инвестфонд купил 49,9% акций строящейся подводной ЛЭП Греция-Кипр-Израиль

Французский инвестиционный фонд Meridiam SAS, специализирующийся на инвестициях в долгосрочные инфраструктурные проекты, приобрел у греческой электрической компании IPTO 49,9% прав на проект Great Sea Interconnector. Сумма сделки не сообщается.


Ниже есть продолжение.

О намерении французов купить долю в проекте по соединению электрических сетей Греции, Кипра и Израиля путем прокладки подводных кабелей сообщалось еще в июне 2024 года, когда Meridiam подписал протокол о намерениях по его финансированию.

Ранее проект получил грант в размере 657 миллионов долларов от Еврокомиссии. Греческая электрическая компания IPTO, которая отвечает за реализацию проекта, ведет переговоры о получении финансирования с частными банками, с Банком Кипра и с американской государственной Корпорацией по финансированию проектов развития.

Строительство проекта началось в 2023 году с работ по прокладке кабеля между греческим островом Крит и Кипром. Сроки прокладки участка Кипр-Израиль на данный момент не определены.

https://www.newsru.co.il/finance/20dec2024/meridiam305.html

ההערכה בישראל: החות׳ים יגבירו את קצב התקיפות על ישראל, ייתכן משמעותית (Hebrew)