Что если попросить искусственный интеллект оценить художественную ценность мясных фотографий?

Сардиния

Здесь, в Кальяри я за выходные отщёлкал почти 200 кадров. Это не очень много, а по меркам прошлых фото-лет так вообще крохи, однако сидеть и перебирать снимки времени не было, нет и не будет. Бэклог тянется до 2013 года, если не ошибаюсь, и я уж рукой махнул.

Лень было отсматривать все фотографии из недавней поездки на Сардинию, и я решил протестировать возможности свежего лаптопа с дикими гигабайтами памяти. Установил LM Studio, накачал мультимодальных сетей, чтоб запускать локально:

  • mistralai/mistral-small-3.2
  • qwen/qwen2.5-vl-7b
  • google-gemma-3-27b-it-qat-small — поделка мастеров, медленная оказалась
  • google/gemma-3-12b — официальная от гугла
  • deepseek/deepseek-r1-0528-qwen3-8b

Загрузил все — ушло, 75% памяти. Дальше будет пост с непонятными словами и понятными (человеку) картинками.

Читать дальше →

Комментарии

 

Я потратил $1000 на ИИ-помощника-программиста, и…

Обрезанная офисная стул и элементы ограждения на тротуаре, рядом валяется пустая банка.
Результат работы ИИ-урбаниста

Здесь в Кракове я решил проанализировать свои траты на Devin (ИИ-разработчика) за последние 72 дня. Данные оказались интереснее, чем ожидал. Сижу на плане, в котором оплата сколько съел.

  • Спустил $1,017 за 72 дня ($14.13 в день)
  • Закрыл 129 из 158 пулл-реквестов команды
  • Средняя стоимость моего PR — $6.48
  • Сложность задач выросла в 4 раза — это я учусь ставить задачи, пожалуй, об этом ниже.
  • Быстрые фиксы («подвинь кнопку»)обходятся в $2.25, сложные фичи (буквально вот только что запушил: «добавь авто-заполнение на поля, чтоб ИИ подсказывал варианты сам на основе предыдущих полей» — $42.75
  • Пиковая, прошлая, неделя съела $395 — это я пилил внутреннюю компанейскиую систему знаний
  • Обычная неделя — это $99 🚀 — удобно считать.
  • 76.6% смерженных PR. Остальное — пока в мусорку.

Почему в мусорку? Достану из широких штанин важный для понимания сути языковых моделей график.

Чем дольше ИИ крутит токены, тем больше накапливает ошибок, начинает путаться и выдумывать. Шанс того, что таск будет сделан:

  • Через 1 час: 53%
  • Через 4 часа: 8%
  • Черуз 10 часов: 0.002% — нет шансов, короче.

Поэтому — прям по дизайну этих всех систем, построенных на угадывании наилучшим образом подходящих кусочков слов — супер-важно дать на входе нормальные данные и подробно описать задачу. «По ходу дела» разобраться скорее всего не получится.

Так я перестал быть вайбкодером и превратился в контекстного инженера — Context Engineer. Этот специалист — я — держит в голове всю суть проекта и одновременно способен опускаться до уровня миниатюрных деталей (скругления краёв на кнопках, где какие переменные лежат). Контекстный инженер может по оформленной продуктовой задаче разложить её по полочкам настолько подробно, что даже последовательный, но больной на голову, как пациент из фильма «Мементо», агент искусственного интеллекта может её решить.

Когда вам кажется, что ИИ тупой и налепил глупостей — а вы точно донесли до него суть задачи? ИИ всего лишь угодливо заполняет пустые места.

На графиках видно, что Claude 3.7 побеждает, потому что обрыв, потеря разумности наступает чуть-чуть позже, чем у других. Буквально по этой причине длинные чаты в Cursor надо обрывать и переначинать в новом чате. А Devin, например, трекает длительность сессии и показывает ⚠️, когда происходит переполнение, и даже не в контекстном окне дело, а просто в повторении .

Меня крайне забавляет, что это ну очень похоже на то, как устроены люди. Представьте, что вы попали на рабочий созвон: первые 10 минут — самые продуктивные. После полутора часов болтовни ничего хорошего не придумается, это изнурение, это мука, это пытка. LLM имитируют жизнь. Смотрим второй график.

Шанс ошибки у человека снижается медленнее, поэтому со временем он выигрывает на длинных дистанциях. Это может быть связано с сохраняющимся человеческим преимуществом (или просто с тем, что данные по людям усреднены по разным уровням мастерства). А может просто масштаб в 10 раз более крупный. Заставлять людей решать задачи в течение месяца, чтобы увидеть на вторую неделю кранча резкий спад, я смею предположить, не могли. Впрочем, мы отошли от сути ненадолго.

Так или иначе, выходит, что я трачу $442/месяц, план за $500 — это –$58, но план даёт запас в 152 ACU (облачное компьютерное время) для роста. Не знаю, нужны ли экстра ресурсы, и так очень активно пользовался.

Теперь думаю — $7 за задачу это дорого или дешево, если есть альтернатива нанять мясного программиста за $2000+? Пока склоняюсь к тому, что ИИ окупается.

Вайбкодинг — был всегда. В потоке люди  писали мясной код из головы, когда всё собрано, есть полная ясность — всегда писали, много и мало. Зато, они, люди, говорят, хороший код. Переписывание этого «хорошего кода» — обычная работа для армии разработчиков среднего звена.

Когда ты забираешься на вершину горы, залезаешь в пещеру и месяц что-то делаешь — как в фильме про монахов Шао-Линь, выходишь с какими-то набросками на руках ручкой написанными, пушишь их и такой: «Ааа, бля, оно так не будет работать», и дальше еще месяц по наитию делаешь что-то другое — это жутко медленный, мучительный мясной вайбкод.

Дипворк-программирование — контекстный инжиниринг, ага — сегодня — это когда ты сначала делаешь архитектуру в Гугл Доксе, а потом по ней один раз начисто пишешь (Девином, Клодом или Курсором, или командой людей). И на выходе получаешь продуманное рабочее решение. Таких специалистов мало, и это то, о чём говорил Карпати на недавней конференции — «Build for agents 🤖«.

P.S.: Всякое такое пишу в канал ИИзвестия, 400+ человек уже читают. Монетизировать не планирую, только доллары жечь на токены.

Комментарии

 

Плёночные фотографии снова в тренде

Здесь в Кракове я обнаружил фотолабораторию в подвале через дорогу и подружился с общительным паном. Купил (сломанный, как оказалось впоследствие) Зенит на местном аналоге Трейдми и отщёлкал пару плёнок. Потом сделал апгрейд на Praktica MTL 5. Даже ухитрился попробовать чёрно-белый формат: Fomapan 200 Creative чешский, если кому интересно. Давно не писал в блог, просто покажу красивые картинки из польских лесов в Закопане, Вены и Кракова.

Читать дальше →

Комментарии

 

Диванный магнетизм и абсурдная радиация

Здесь в Кракове +6°C, я прошёл 40 километров за выходные, и ноги приятно побаливают. Гулял долго, аж успел записать в iMessages длиннющие соображения по теме… Ну, скажем так, вообще всего.

Сразу к сути. С точки зрения ницшеанства и стоицизма, где сам-всё-сам и «бесконечность до тебя, бесконечность после тебя, жизнь — только миг между прошлым и будущим»; иллюзию контроля я принимаю, как лучшее, что у нас есть. Это лучший инструмент, доступный человеку, чтобы не сойти с ума и не ползти к кладбищу. Иллюзорность, как мне кажется, очевидна: можно от занозы в пальце умереть, от рака, от сосульки, под машину попасть. Всё это совершенно точно может случиться с каждым. Но пока не случилось. Пока есть возможность, надо барахтаться.

Мы пишем свою историю сами: сами боремся за возможность выбирать, а потом этот выбор реализуем через действия. Кто что выбирает через действия получать — эмоции, деньги, адреналин, славу — дело десятое, очень индивидуальное. Обсуждать границы выбора сегодня не буду, слишком уж большая тема, не влезет.

Размышления о свободе приводят к парадоксу: с одной стороны, мы осознаем, что многие аспекты жизни находятся вне нашего контроля. Рождение и смерть, как и другие внешние обстоятельства, предопределены неизбежными законами природы и общества. Именно способность выбирать и действовать придаёт нашему существованию смысл. Это стоический компонент.

Ницшеанство, с другой стороны, подчёркивает необходимость творческого преодоления собственных слабостей и максимально смелого утверждения индивидуальности — аутентичности: быть тем, кто ты есть на самом деле. Быть, а не казаться. Ницше призывал убить сверхъестественное (бога), разжать хватку внешних сил (судьбы) и в меру своих сил стать творцом собственной судьбы — отвергнуть навязанные стереотипы, создать новые, свои личные ценности. Даже если иллюзия контроля лишь утешает нас в условиях непредсказуемости мира, именно это ощущение даёт нам силы действовать и преодолевать границы, кажущиеся непреодолимыми. «Так говорил Заратустра».

Дополню философский коктейль французской линией: соус чили в Кровавой Мэри. Осознание абсурдности мира не должно вести к апатии. Напротив, признание конечности бытия обостряет стремление к свободе и творческому самовыражению. Каждый выбор, каждая мелочь, которой мы наполняем жизнь — наполняет её смыслом, становится актом бунта против вселенской безразличности. Вселенная — это в прежде всего пустота, пыль, тлен, ядовитые газы и смертельная радиация. Человек наполняет её смыслом, Камю был прав.

Несмотря на неизбежность определённых жизненных обстоятельств, мы можем и должны находить силы для выбора, для творческого самовыражения и для борьбы за свою свободу.

Так вот, в мире хаоса и никомуненужности у каждой истории есть начало и конец. Абсолютные границы — рождение и смерть — предопределены, и изменить их невозможно. Книги, в которых от рождения до смерти всё подробно рассказывается, скучны и занудны. Личными действиями (волей) можно историю красиво начать и изящно закончить.

Пойти по пути наименьшего сопротивления, где никакие истории сочинять не придётся, и ничего особенного не случится — такой расклад манит, как мягкий диван и comfort food.

«Приключения? Вряд ли в наших краях вы найдёте кого-то, кому могут понравиться приключения. От них одни проблемы, ещё обед пропустишь!»

Бильбо Бэггинс, Хоббит

И в чём Бильбо неправ? Мой друг использует метафору с крышку гроба, мол, деньги есть, семья есть, друзья есть, всё налажено, всё в балансе, сижу в своём доме у бассейна, и слышу: «Тук, тук, тук…» Это гвозди в крышку гроба забивают. Имея возможности и свободу, выбрать комфортную жизни «как у всех» — это как самостоятельно сколотить себе гроб с мягкой обивкой внутри, залезть в него и ждать, когда всё само закончится. Оно точно закончится. Надо только почиллить немного.

«Once upon a time…» — универсальное начало: ясно, что будут приключения! Какими бы эти приключения ни были — удачными или не очень, длинными или короткими, мирового масштаба или приватными, личными.

«Жили они долго и счастливо…» — последняя строка истории. Конец.

Комментарии

 

Предсказания

Искусственные предсказания

Здесь в Кракове подумал чуть над тем, что в недалёком будущем изменится в связи с приходом искусственного интеллекта. Речь не о гибели человечества, не хочу набрасывать и шокировать. Мы переживаем ещё одну «революцию», сравнимую с изобретением печатного станка и интернета. Не в первый раз такое. И не в последний, надеюсь. Как изменится ход жизни? Как изменится внутренний мир кожаных мешков, человеков разумных? Неизвестных в уравнении много, но есть и константы: кое-какие аналогии можно провести, опираясь на исторический контекст, как мне кажется.

Отец говорил когда-то: «Уходит поколение крестьян». Мой дед мог вспахать поле, засеять, муку молоть, хлеб печь — сейчас люди просто не помнят, как это делать. Он не помнит, я уже банально не знаю. Следующее поколение ещё на шаг дальше от этого.

Раньше уклад жизни менялся за поколение-два-три, долгосрочные закономерности замечали старики и долгожители, но суть не менялась: изменение того, как мы думаем, происходит каждый раз, когда случается «революция», подобная той, что сейчас идёт в мире технологий и искусственного интеллекта. На этот раз всё очень быстро летит: не за декады, а за годы.

Мне не очень повезло родиться в СССР, в развитых странах всё нижеперечисленное случилось на 5-10 лет раньше. Временнáя дистанция сокращалась после развала Совка и при путинизме снова увеличится, но суть от этого не меняется. Мне повезло поучаствовать в нескольких таких качественных переходах: появление компьютеров в 90-х, развитие сетей и интернета в нулевых, взлёт социальных сетей и создание мобильных компьютеров-телефонов, крипто, искусственный интеллект! Волшебно просто.

Мои родители пользовались логарифмическими линейками и бумажными справочниками для расчётов интегралов, у меня уже были калькулятор, компьютеры и даже Wolfram Mathematica в студенчестве. Я из поколения, которое ещё помнит, как нужно помнить номера телефонов и как можно не знать как попасть из точки А в точку Б, потому что нет с собой карманного компьютера, нет спутников GPS, нет аппов, ничего этого просто нет.

Думали ли мы тогда по-другому? Я думаю, да. Как менялся способ мышления? Медленно, но верно. Уверен, что искусственный интеллект — событие, сравнимое с появлением интернета или мобильного телефона — только движется оно в 10 раз быстрее. Не встанут ли наши мозги колом от необходимости так резко переплавиться?

Читать дальше →

Комментарии