You don't have to be real to be the Doctor. (c) the Doctor
Подъехало еще две бесплатные модели ИИ-чатиков:
- ChatGPT o3-mini
- Llama 3.3 70B

Результаты теста на
Что больше 6,9 или 6,11 ?
прям не знаешь, что хуже:

Лама 3.3 - неправильно: 6,11 больше, чем 6,9.

o3-mini - правильно, но... это же целое эссе! - и без поллитра в нем не разберешься...


@темы: ИИ проблемы, тесты для ИИ, tests for AI, AI chatbots, AI problems, ИИ-чатиrb