Пять минут назад нейросети были чем-то из области науки-фантастики, а теперь ты на кухне показываешь телефону фотку кота и получаешь название породы. Тебе не понадобится «заказывать датасет в облаке» и учить Python — хватит двух свободных приложений и поверхностного интереса. Разберись, как лично ты запустишь свою первую нейросеть на Android или iPhone за четверть часа.
Что вообще будет делать твоя нейросеть?
Ты соберёшь «узкого специалиста»: например, классифицирует фото по контейнерам для мусора, распознаёт сорта пиццы или (для продвинутых) проверяет, настоящая ли подпись на документе. Главное — задать лёгкую задачу. Даже на процессоре смартфона такие модели работают быстрее блина.
Аппаратная проверка: будет ли телефон подтормаживать?
Проверь три вещи за минуту:
- Android выше 9 или iOS выше 16.
- ОЗУ не ниже 4 ГБ (ищи в «О телефоне» или в настройках iPhone «Об этом устройстве»).
- Свободно 1,5 ГБ в памяти. Чисти заброшенные мемы заранее.
Слишком стар? Используй облачный вариант — приложение будет тянуть мощности прямо из интернета, а не от SoC.
Какие приложения не придётся оплачивать
Название | Платформа | Тип модели | Русский интерфейс |
---|---|---|---|
Teachable Machine | Android, iOS, Web | Классификация изображений | Да |
Lobe (Microsoft) | iOS, Web | То же плюс звук | Частично |
AI Dungeon | Android, iOS | Да |
Teachable Machine от Google — оптимальный старт. Без подписок, без кода, работает офлайн после экспорта.
Собираем первый датасет прямо на диване
Датасет = 50-100 фото в категории. Ищем под рукой:
- Кофе и какао (две категории).
- Коты и собаки.
- Рабочий и выходной стул (угадает стресс по вашему «боевому месту»).
Съёмки по правилам: одинаковое освещение, вертикальная ориентация, не зумь. Где взять классы? Просто сфоткай 50 фото каждой породы котов пока гладишь за ухом.
Три клика в Teachable Machine
Шаг 1. Открой teachablemachine.withgoogle.com в Chrome на телефоне → выбери «Image Project → Standard Image Model».
Шаг 2. Нажми «+ Add a class», дай название. Допустим, «Espresso». Нажми «Webcam» и сфотографируй 60 снимков чашки под разным углом.
Шаг 3. Добавь второй класс — «Latte». Снимай пенку сверху, боком, подсветки нет — нейронка научится не доверять бликам.
Шаг 4. Жмём «Train Model» → wait. Обучение занимает 10-30 секунд на Snapdragon 778G.
Шаг 5. «Preview» → поднеси чашку — телефон подписывает класс с процентом уверенности. Покажи друзьям — они офигеют.
Как сохранить модель и не потерять его после закрытия вкладки
Жми «Export Model» → «Download my model». Получаешь папку с файлами .json и .bin. Кидай в Google Drive или рассылку в Telegram-канал «вдруг пригодится».
Запускаем модель офлайн
Захвати мини-приложение «TM Preview», доступное на GitHub. Установишь Apk, положишь эту же модельку в папку /Download/TMPreview/models. Теперь твоя нейросеть будет работать без Интернета и лишних данных. iPhone? Используй короткий шорткат через Shortcuts или загрузи готовый ipa ежели ты энтузиаст jailbreak.
А если я хочу реально продавать решение?
Teachable Machine выдаёт tflite-файл. Чтобы встроить в Android-приложение, добавь зависимость org.tensorflow:tensorflow-lite
через Gradle. Остальное скопируешь как LEGO. День — и ты на Google Play с собственной версией «Кофейного эксперта».
Типичные ошибки новичков
- Перетрен. Снял 500 фото одного вида — модель переобучится и будет путать «Эспрессо» с «Латте» из-за лишнего низа.
- Разные пропорции. Горизонтальный и вертикальный кадры, нейросеть перепутает формат — показывай только одинаковые.
- Рук-ом фон. Если границы фото различаются по цвету стола, модель запомнит именно цвет — в помещении с другой мебелью всё сломается.
- Недостаточный датасет. Меньше 20 фото на категорию — результат «монетка». Делай минимум 50.
Дополнительные инструменты без кода
Lobe (Microsoft). Качается в AppStore, делает всё то же самое, но добавляет «Confusion matrix» и «roc-curve» — для демонстрации боссу.
Runway (iOS/Android). Даёт генеративные модели. Например, ты загружаешь портрет и получаешь бесконечные варианты лица стиля Ghibli.
MakeML. Для продвинутых: ар-аугментация, экспорт в CoreML и TensorFlow с одним тапом.
Что потренировать дальше
- Распознавание банкнот на подлинность — пригодится на отдыхе.
- Определение степени зрелости авокадо по нажатию пальцем на экран (классификация «слишком твёрдое/идеально/переспело»).
- Разграничение собственных ключей от маминых под шумом ночного клуба.
Резюме: твоя первая нейросеть сработала быстрее чайника
Тебе хватило 15 минут, двух приложений и трёх категорий кофе. Осталось расширять бизнес: тренируй модель на проигрываемые инструменты и продавай в App Store как «Автоматический определитель чипсов Lays vsoff-brand». Ты не программист — ты владелец ИИ-решения, которое весит 14 МБ и работает офлайн. Делись идеей, сохраняй модели в облаке и не бойся фразы «без кода» — она уже не означает «для лентяев», а значит «для всех».
FAQ: Частые вопросы
Можно ли сделать это на планшете? — Да, любой Android или iPad OS.
Если интернет медленный? — Загрузи модель заранее, остальное работает офлайн.
Что будет, если я сфоткаю котика и назову классом «сметана»? — Нейронка выучит статистику, но этика красного цвета у преподавателя ИИ пострадает. Выбирай ясные визуальные признаки.