Важно

  •  

Monday, March 17, 2025

OpenAI "Full Code Automation" Coming (English, Russian)

There is summary below.
Ниже есть краткое содержание.
Ниже есть продолжение.

Итак, это Кевин Уил, главный продукт-менеджер Open AI, пятикратный обладатель награды AI Weekly за самую очаровательную улыбку. Недавно он появился на подкасте Overpowered, чтобы рассказать о том, как, по его мнению, будет развиваться будущее разработки программного обеспечения, какую роль в этом сыграет искусственный интеллект и стоит ли ожидать, что всё программирование будет практически полностью автоматизировано ИИ.

Кевин утверждает, что 2025 год станет тем самым годом, когда ИИ навсегда превзойдёт людей в программировании. Давайте разберёмся, почему он так считает. Подсказка: дело в способности к рассуждению, а именно в обучении с подкреплением и больших языковых моделях, которые превращаются в большие модели рассуждения. Рост в этой области просто невероятный. Недавно я разговаривал с кем-то из Anthropic, примерно пару недель назад, и спросил: есть ли у Anthropic прогноз, когда код станет автоматизированным на 99%? Я имею в виду настоящий функциональный код для фронтенда и бэкенда. Они ответили: да, 2027 год. А у вас есть какие-то сроки? Есть ли у вас хотя бы гипотеза, как это будет развиваться? Честно говоря, с такой скоростью развития я удивлюсь, если это произойдёт только в 2027 году. Думаю, это случится раньше. Кевин же сказал: если Anthropic называет 2027 год, мы скажем 2026-й. Когда мы запустили GPT-4.0, это была очень хорошая модель для программирования, например, для бэкенда GitHub Copilot и других инструментов. Люди используют её по всему миру в огромных масштабах. Но это даже не сравнится с тем, что было, когда мы представили предварительную версию O1. Она оказалась намного лучше как модель для кодирования, потому что в написании кода важна способность к рассуждению. Когда вы занимаетесь чем-то сложным — будь то кроссворд, судоку или написание кода, — вам нужно уметь разбивать проблему на более мелкие части, выдвигать гипотезы, проверять их или опровергать. Именно это и делает рассуждение.

Предварительная версия O1, насколько я помню, была примерно на миллионном месте среди лучших конкурентных программистов в мире. Если взять программистские соревнования и прогнать её через них, она займёт примерно миллионное место. Это не звучит впечатляюще, но в мире, наверное, 30–40 миллионов программистов, так что это верхние 2–3%. А вот O1, когда мы впервые полноценно её запустили как модель для кодирования, оказалась уже на тысячном месте среди лучших инженеров мира в соревновательном программировании. Модель O3, которая скоро выйдет, по тем же тестам занимает 175-е место среди лучших конкурентных программистов. А те модели, которые мы сейчас тренируем как их продолжение, уже превосходят эти результаты. Так что я думаю, именно в этом году, если судить по бенчмаркам конкурентного программирования, ИИ станет лучше людей в программировании навсегда. Это как с компьютерами, которые обогнали людей в умножении 70 лет назад, или как ИИ превзошёл людей в шахматах 15 лет назад. В этом году ИИ станет лучше людей в программировании, и пути назад уже не будет. Мы в Open AI вкладываем в это огромное количество усилий, Anthropic делает то же самое, Google тоже активно работает в этом направлении. Из всех технологий именно эта будет развиваться невероятно быстро. И я думаю, мир изменится благодаря этому, причём в лучшую сторону. Представьте, сколько всего можно будет сделать, если для создания программного обеспечения не нужно быть инженером. Ведь с помощью софта можно создать почти что угодно. Какой демократизирующий эффект это может оказать на мир, если каждый сможет писать программы!

Важно понимать, что многое из этого вызывает споры. Некоторые считают крайне маловероятным, что ИИ полностью автоматизирует разработку софта. Многие говорят, что вместо этого в профессию придёт масса разработчиков, которые ничего не умеют, полагаясь на ИИ, который будет выдавать "ИИ-мусор". И тогда будет ещё важнее действительно разбираться в том, как работает софт, что делает код, знать все тонкости. Такие люди будут зарабатывать, исправляя ошибки ИИ. Недавно я тестировал Claude Code и нового агента Manis AI, который только что вышел. Интересно, что набор приложений для ИИ-агентов по кодированию почти сформирован. Многие знакомы с Cursor — это среда разработки, где можно использовать любую модель, например, модель с рассуждением от Open AI или Anthropic. Но я думаю, следующий уровень — это что-то вроде Claude Code с функцией использования компьютера. Manis, кажется, действительно попал в точку с архитектурой. Я не рекламирую Manis, просто считаю, что их концепция и подход к дизайну будут копироваться, потому что они сделали что-то потрясающее.

Cейчас у нас почти есть все части, чтобы создать что-то, способное выполнять любые действия за компьютером, как человек. Возьмём новичка после первого урока программирования: он может открыть терминал, ввести команды, открыть браузер, почитать документацию на GitHub, написать код, упаковать файлы и отправить их. Это как удалённый работник — ИИ сможет делать всё, что может такой человек. Это что-то вроде Manis плюс Operator от Open AI или Claude Code плюс Operator, хотя Claude пока кажется больше как помощник, с которым нужно общаться. Manis же для сложных задач может уйти, сделать всё сам и вернуться с готовым проектом...Кажется, мы почти собрали все части для идеальной структуры агента для разработки софта. Добавим лучшую модель для кодирования — и увидим, станет ли это автоматизированным разработчиком. Думаю, это произойдёт в этом году, и тогда станет ясно, где мы находимся в этом процессе. Сейчас идут споры: будут ли это просто крутые инструменты для помощи разработчикам, как сказал Кевин, когда ты знаешь, что нужно, но впереди много рутины? Или ИИ сможет справляться с новыми, творческими задачами, где нужно глубоко думать и проверять, всё ли работает? Это главный вопрос: когда это случится — в этом году, в 2027-м или позже? ИИ, который отлично пишет код, сможет создавать почти всё, что угодно, и это сильно повлияет на мир — не только на рабочие места, но и на возможности каждого создавать софт для своих проектов.

Это будет невероятно! Open AI, Anthropic, Google вкладывают в это огромные ресурсы. Ходят слухи о новой версии Deep Seek, R2, которая скоро выйдет и обещает улучшенные способности к кодированию. Что будет, если подключить такую открытую систему к подобной архитектуре? И это уже не только про софт. Один человек сделал MCP, чтобы Claude общался с Blender — программой для создания 3D-объектов и сцен. Anthropic представили Model Context Protocol в ноябре, это стандартизирует подключение больших языковых моделей к другим инструментам. Представьте: Claude пишет код, подключается к Blender, создаёт 3D-миры — например, низкополигонального дракона, охраняющего сокровища, — а потом это можно использовать в играх. Я не могу предсказать будущее, и многие умные инженеры объясняют, почему сложные части разработки софта трудно автоматизировать, почему ИИ-код будет хаосом, полным ошибок. Они могут быть правы. Но CEO Microsoft, Google, Open AI, Anthropic, Илон Маск с xAI — все они направляют огромные ресурсы на решение этой задачи. xAI даже открыла игровую студию, чтобы делать видеоигры с помощью ИИ.

Если они создадут агента для разработки софта, он, вероятно, сможет автоматизировать и другие задачи. Я бы предсказал рост безработицы или хотя бы смещение рабочих мест, особенно для простых задач, не требующих гениальности, а просто труда и базовых навыков. В прошлом видео про Manis кто-то сказал, что он может выполнять 85% их работы. Это начнётся уже в 2025 году. Когда появятся первые агенты для разработки, мы лучше поймём, куда всё идёт. Если дать им все инструменты — зрение, структуру — и они всё равно не справятся, значит, это не так близко. Но я тестирую это два года и всё сложнее придумывать задачи, с которыми они не справляются. Конечно, мои тесты не про огромные базы данных или гигантский контекст — это может быть ещё одним препятствием. В любом случае, нас ждут захватывающие времена.

So, this is Kevin Wheel, the Chief Product Officer at Open AI, a five-time winner of AI Weekly’s Most Charming Smile award. Recently, he appeared on the Overpowered podcast to discuss his views on how the future of software development will unfold, the role artificial intelligence will play in it, and whether we should expect programming to become almost entirely automated by AI.

Kevin claims that 2025 will be the year when AI surpasses humans in programming for good. Let’s dive into why he thinks so. Hint: it’s about reasoning ability, specifically reinforcement learning and large language models evolving into large reasoning models. The growth in this area is simply staggering. A couple of weeks ago, I spoke with someone from Anthropic and asked if they had a timeline for when code would become 99% automated—real, functional code for front-end and back-end. They said yes, 2027. Do you have any timelines? Do you have a hypothesis about how this might play out? Honestly, with the pace we’re seeing, I’d be surprised if it takes until 2027. I think it’ll happen sooner. Kevin, meanwhile, said: if Anthropic is calling it 2027, we’ll say 2026. When we launched GPT-4.0, it was a really solid coding model—think back-end for GitHub Copilot and other tools. People are using it on a massive scale worldwide. But it doesn’t even compare to what happened when we rolled out the O1 preview. That was a far better coding model because reasoning matters in coding. When you’re tackling something complex—whether it’s a crossword, Sudoku, or writing code—you need to break the problem into smaller pieces, form hypotheses, test them, or disprove them. That’s what reasoning does.

The O1 preview, as I recall, ranked around a millionth among the world’s top competitive programmers. Run it through programming competitions, and it lands at about a millionth place. That doesn’t sound impressive, but with maybe 30–40 million programmers globally, that’s the top 2–3%. When we first fully launched O1 as a coding model, it hit around the thousandth spot among the world’s best engineers in competitive programming. The upcoming O3 model, based on the same benchmarks, ranks 175th among top competitive programmers. And the successor models we’re training now are already outperforming those results. So, I think this year—judging by competitive programming benchmarks—AI will become better than humans at programming forever. It’s like how computers outpaced humans at multiplication 70 years ago, or how AI beat humans at chess 15 years ago. This year, AI will outdo humans at programming, and there’s no going back. At Open AI, we’re pouring massive effort into this. Anthropic is doing the same, and Google is heavily invested too. Of all technologies, this one will advance at breakneck speed. And I think the world will change because of it—for the better. Imagine what you could do if you didn’t need to be an engineer to create software. With software, you can build almost anything. What a democratizing impact this could have on the world if everyone could write programs!

It’s worth noting that a lot of this is up for debate. Some think it’s highly unlikely that AI will fully automate software development. Many argue that instead, we’ll see a flood of developers who don’t know much, relying on AI to churn out “AI slop.” Then, it’ll be even more critical to truly understand how software works, what code does, and all the nuances. Those people will make money fixing AI’s mistakes. Recently, I’ve been testing Claude Code and the new Manis AI agent that just came out. What’s interesting is that the toolkit for AI coding agents is nearly complete. Many know Cursor—a development environment where you can plug in any model, like a reasoning model from Open AI or Anthropic. But I think the next level is something like Claude Code with computer-use capabilities. Manis seems to have nailed the architecture. I’m not pitching Manis—I just think their concept and design approach will be replicated because they’ve done something amazing.

Right now, we’ve almost got all the pieces to create something that can do anything a human can behind a computer. Take a newbie after their first coding class: they can open a terminal, type commands, browse GitHub for documentation, write code, zip files, and send them off. It’s like a remote worker—AI will be able to do everything they can. Think Manis plus Open AI’s Operator, or Claude Code plus Operator, though Claude still feels more like an assistant you chat with. Manis, for complex tasks, can go off, do everything itself, and come back with a finished project. It seems we’ve nearly assembled all the parts for the perfect agent framework for software development. Add the best coding model, and we’ll see if it becomes an automated developer. I think it’ll happen this year, and then we’ll know where we stand in this process. Right now, there’s debate: will these just be cool tools to help developers, as Kevin said, when you know what you need but face a lot of grunt work? Or can AI handle new, creative tasks requiring deep thought and verification? That’s the big question: when will it happen—this year, 2027, or later? An AI that codes brilliantly could create almost anything, massively impacting the world—not just jobs, but everyone’s ability to build software for their projects.

It’s going to be incredible! Open AI, Anthropic, and Google are throwing huge resources at this. Rumors are swirling about a new Deep Seek version, R2, coming soon with enhanced coding skills. What happens when you plug an open-source system like that into this kind of architecture? And it’s not just about software anymore. Someone built an MCP so Claude could talk to Blender—a program for creating 3D objects and scenes. Anthropic introduced the Model Context Protocol in November, standardizing how large language models connect to other tools. Imagine Claude writing code, linking to Blender, and crafting 3D worlds—like a low-poly dragon guarding treasure—then using that in games. I can’t predict the future, and plenty of brilliant engineers argue why automating the tough parts of software development will be hard, why AI code will be a chaotic mess full of errors. They might be right. But the CEOs of Microsoft, Google, Open AI, Anthropic, and Elon Musk with xAI are all funneling massive resources into solving this. xAI even launched a gaming studio to make video games with AI.

If they create a software development agent, it’ll likely automate other tasks too. I’d predict a rise in unemployment or at least job displacement, especially for simple tasks that don’t need genius—just effort and basic skills. In a past video on Manis, someone said it could do 85% of their job. That’ll hit in 2025. When the first development agents arrive, we’ll get a clearer picture of where this is headed. If we give them all the tools—vision, structure—and they still falter, maybe it’s not so close. But after testing these for two years, I’m finding it harder to come up with tasks they can’t handle. My tests don’t involve huge databases or massive context windows—that could be another hurdle. Either way, exciting times are ahead.


No comments:

Post a Comment