← Назад

Пошаговая инструкция по созданию простой искусственной нейросети прямо на Android или iPhone. Без навыков программирования — только приложения и 15 минут времени.

Пять минут назад нейросети были чем-то из области науки-фантастики, а теперь ты на кухне показываешь телефону фотку кота и получаешь название породы. Тебе не понадобится «заказывать датасет в облаке» и учить Python — хватит двух свободных приложений и поверхностного интереса. Разберись, как лично ты запустишь свою первую нейросеть на Android или iPhone за четверть часа.

Что вообще будет делать твоя нейросеть?

Ты соберёшь «узкого специалиста»: например, классифицирует фото по контейнерам для мусора, распознаёт сорта пиццы или (для продвинутых) проверяет, настоящая ли подпись на документе. Главное — задать лёгкую задачу. Даже на процессоре смартфона такие модели работают быстрее блина.

Аппаратная проверка: будет ли телефон подтормаживать?

Проверь три вещи за минуту:

  • Android выше 9 или iOS выше 16.
  • ОЗУ не ниже 4 ГБ (ищи в «О телефоне» или в настройках iPhone «Об этом устройстве»).
  • Свободно 1,5 ГБ в памяти. Чисти заброшенные мемы заранее.

Слишком стар? Используй облачный вариант — приложение будет тянуть мощности прямо из интернета, а не от SoC.

Какие приложения не придётся оплачивать

Генерация текста
НазваниеПлатформаТип моделиРусский интерфейс
Teachable MachineAndroid, iOS, WebКлассификация изображенийДа
Lobe (Microsoft)iOS, WebТо же плюс звукЧастично
AI DungeonAndroid, iOSДа

Teachable Machine от Google — оптимальный старт. Без подписок, без кода, работает офлайн после экспорта.

Собираем первый датасет прямо на диване

Датасет = 50-100 фото в категории. Ищем под рукой:

  1. Кофе и какао (две категории).
  2. Коты и собаки.
  3. Рабочий и выходной стул (угадает стресс по вашему «боевому месту»).

Съёмки по правилам: одинаковое освещение, вертикальная ориентация, не зумь. Где взять классы? Просто сфоткай 50 фото каждой породы котов пока гладишь за ухом.

Три клика в Teachable Machine

Шаг 1. Открой teachablemachine.withgoogle.com в Chrome на телефоне → выбери «Image Project → Standard Image Model».

Шаг 2. Нажми «+ Add a class», дай название. Допустим, «Espresso». Нажми «Webcam» и сфотографируй 60 снимков чашки под разным углом.

Шаг 3. Добавь второй класс — «Latte». Снимай пенку сверху, боком, подсветки нет — нейронка научится не доверять бликам.

Шаг 4. Жмём «Train Model» → wait. Обучение занимает 10-30 секунд на Snapdragon 778G.

Шаг 5. «Preview» → поднеси чашку — телефон подписывает класс с процентом уверенности. Покажи друзьям — они офигеют.

Как сохранить модель и не потерять его после закрытия вкладки

Жми «Export Model» → «Download my model». Получаешь папку с файлами .json и .bin. Кидай в Google Drive или рассылку в Telegram-канал «вдруг пригодится».

Запускаем модель офлайн

Захвати мини-приложение «TM Preview», доступное на GitHub. Установишь Apk, положишь эту же модельку в папку /Download/TMPreview/models. Теперь твоя нейросеть будет работать без Интернета и лишних данных. iPhone? Используй короткий шорткат через Shortcuts или загрузи готовый ipa ежели ты энтузиаст jailbreak.

А если я хочу реально продавать решение?

Teachable Machine выдаёт tflite-файл. Чтобы встроить в Android-приложение, добавь зависимость org.tensorflow:tensorflow-lite через Gradle. Остальное скопируешь как LEGO. День — и ты на Google Play с собственной версией «Кофейного эксперта».

Типичные ошибки новичков

  • Перетрен. Снял 500 фото одного вида — модель переобучится и будет путать «Эспрессо» с «Латте» из-за лишнего низа.
  • Разные пропорции. Горизонтальный и вертикальный кадры, нейросеть перепутает формат — показывай только одинаковые.
  • Рук-ом фон. Если границы фото различаются по цвету стола, модель запомнит именно цвет — в помещении с другой мебелью всё сломается.
  • Недостаточный датасет. Меньше 20 фото на категорию — результат «монетка». Делай минимум 50.

Дополнительные инструменты без кода

Lobe (Microsoft). Качается в AppStore, делает всё то же самое, но добавляет «Confusion matrix» и «roc-curve» — для демонстрации боссу.

Runway (iOS/Android). Даёт генеративные модели. Например, ты загружаешь портрет и получаешь бесконечные варианты лица стиля Ghibli.

MakeML. Для продвинутых: ар-аугментация, экспорт в CoreML и TensorFlow с одним тапом.

Что потренировать дальше

  • Распознавание банкнот на подлинность — пригодится на отдыхе.
  • Определение степени зрелости авокадо по нажатию пальцем на экран (классификация «слишком твёрдое/идеально/переспело»).
  • Разграничение собственных ключей от маминых под шумом ночного клуба.

Резюме: твоя первая нейросеть сработала быстрее чайника

Тебе хватило 15 минут, двух приложений и трёх категорий кофе. Осталось расширять бизнес: тренируй модель на проигрываемые инструменты и продавай в App Store как «Автоматический определитель чипсов Lays vsoff-brand». Ты не программист — ты владелец ИИ-решения, которое весит 14 МБ и работает офлайн. Делись идеей, сохраняй модели в облаке и не бойся фразы «без кода» — она уже не означает «для лентяев», а значит «для всех».

FAQ: Частые вопросы

Можно ли сделать это на планшете? — Да, любой Android или iPad OS.

Если интернет медленный? — Загрузи модель заранее, остальное работает офлайн.

Что будет, если я сфоткаю котика и назову классом «сметана»? — Нейронка выучит статистику, но этика красного цвета у преподавателя ИИ пострадает. Выбирай ясные визуальные признаки.

← Назад

Читайте также