Обзор Инструментов ИИ: От Текстов до Кода

Искусственный интеллект — это не только чат-боты. Сегодня модели пишут тексты и код, создают изображения, музыку и видео, собирают презентации и помогают учиться по вашим материалам. В этом кратком обзоре — карта территории. В следующих уроках мы подробно разберем каждый класс инструментов с примерами и готовыми промптами.

Инструменты ИИ

1. Текстовые модели (LLM) — «Мозг операции»

Самый универсальный инструмент в банке. Это ваш персональный ассистент, аналитик и копирайтер.

Что умеют:

  • Писать и редактировать: письма клиентам, пресс-релизы, ТЗ для разработчиков, саммари встреч.

  • Анализировать документы: сравнивать условия договоров, искать риски в отчетах, переводить финансовую терминологию на понятный язык.

  • Планировать: составлять чек-листы для онбординга, roadmaps проектов.

  • Кодить: писать SQL-запросы, скрипты для Excel/Google Sheets, исправлять ошибки в коде.

Ключевые особенности:

  • Мультимодальность: видят не только текст, но и сканы документов, графики в отчетах.

  • Инструменты: могут использовать калькулятор для точных расчетов или искать свежие курсы валют в интернете.

  • Память: помнят контекст диалога (но в пределах лимита окна контекста).

Примеры: ChatGPT, Claude, Gemini, DeepSeek (хорош для кода), Qwen.

Когда использовать: "Холодный старт" любого текста, анализ больших PDF-отчетов, быстрый поиск информации, написание макросов.

2. Генерация изображений — «Визуал»

Что умеют:

  • Маркетинг: баннеры для соцсетей, иллюстрации к статьям в блоге банка.

  • Дизайн: мокапы мобильных приложений, концепты мерча, логотипы для внутренних проектов.

  • Редактирование: убрать лишний объект с фото офиса, расширить фон для презентации.

Примеры: Midjourney, Stable Diffusion, DALL-E 3, Kandinsky (Сбер).

Когда использовать: Когда нужен уникальный вижуал без покупки стоковых фото, для быстрых концептов.

Ограничения: Текст на картинках (надписи) часто генерируется с ошибками. Руки и детали людей могут быть искажены.

3. Генерация музыки — «Звук и атмосфера»

Что умеют:

  • Фоновая музыка для корпоративных роликов.

  • Джинглы для внутренней рекламы или подкастов банка.

Примеры: Suno, Udio, Stable Audio.

Когда использовать: Озвучка обучающих видео, поздравлений, презентаций.

Ограничения: Проверяйте лицензию — не все генерации можно использовать в коммерческих целях (рекламе).

4. Генерация видео — «Оживление контента»

Что умеют:

  • Аватары: создание виртуального спикера из текста (для обучающих роликов по продуктам).

  • Анимация: оживление логотипа или статичного баннера.

  • Монтаж: автоматическая нарезка длинных видеовстреч на короткие клипы.

Примеры: HeyGen (аватары), Runway, Pika, Kling.

Когда использовать: Быстрое создание видеоинструкций, оживление презентаций, контент для соцсетей.

Ограничения: Сложная физика движений пока дается с трудом.

5. Презентации — «Оформление и структура»

Что умеют:

  • Создавать структуру презентации по теме (например "Отчет по кредитному портфелю за Q3").

  • Генерировать дизайн слайдов и подбирать картинки.

Примеры: Gamma, Tome, Beautiful.ai, Copilot в PowerPoint.

Когда использовать: Когда нужно быстро собрать "скелет" выступления или красиво оформить идею.

Ограничения: Дизайн часто требует ручной доработки под фирменный стиль банка.

6. Код и интерфейсы — «Разработка для всех»

Что умеют:

  • Помощь IT: автодополнение кода, написание юнит-тестов, документации.

  • Помощь аналитикам: написание SQL-запросов к базам данных, скриптов Python для анализа данных.

  • Прототипы: генерация веб-страниц по скриншоту наброска на салфетке.

Примеры: GitHub Copilot, Cursor, v0 (от Vercel).

Когда использовать: Ускорение разработки (на 30-50%), создание внутренних дэшбордов.

7. Обучение — «ИИ поверх своих материалов»

Что умеют:

  • (RAG) Отвечать на вопросы по базе знаний банка: "Как открыть счет для ИП?", "Какие условия по ипотеке?".

  • Создавать тесты и квизы для обучения сотрудников.

Примеры: NotebookLM (Google), кастомные GPT.

Когда использовать: Онбординг новых сотрудников, быстрый поиск по регламентам.


Как выбрать инструмент (быстрый чек-лист):

  1. Цель: Текст, Картинка, Код или Видео?

  2. Данные: Есть ли там конфиденциальная информация? (Если да — используем только закрытые корпоративные контуры или обезличиваем данные).

  3. Сложность: Нужен быстрый черновик или финальный продукт? (ИИ идеален для черновиков).

  4. Лицензия: Можно ли использовать результат в коммерции?

Мини-словарь:

  • LLM (Large Language Model): Большая языковая модель (текстовый ИИ).

  • Промпт (Prompt): Текстовый запрос к нейросети.

  • Галлюцинация: Когда ИИ уверенно пишет неправду.

  • RAG (Retrieval-Augmented Generation): Технология, когда ИИ ищет ответ в ваших документах, а не выдумывает.

Что дальше: В следующем уроке мы разберем конкретные сценарии для разных ролей в банке: от юриста до маркетолога.

Last updated