среда, 6 марта 2019 г.

Phobos. Эксперимент по созданию ИИ в архитектуре. Часть 3. Основные виды ИИ

      "Когда компьютер свихнется из-за баб, без обид, или убьет себя из-за лишнего веса, тогда, может быть, я еще поверю в ИИ"
                                                                                                                                   
                                                                                                                                    "Dead like Me"
                                 
            Ну а пока еще этого не произошло (ли ?), давайте для начала посмотрим какие уже задачи решает ИИ. Мне нужно это сделать, что бы отвечать на вопрос - в какой задаче лучше применять тот или иной способ создания структуры ИНС.

        Сейчас под машинным обучением или ИИ многие рекламируют процедурные алгоритмы где нет обучения, просто выполняется заранее подготовленный алгоритм вполне живым человеком, поэтому что бы не было полемики, что я в чем то не прав я решил дать развернутый пост о машинном обучении на который потом буду ссылаться. Такого рода информации в русскоязычном сегменте нет :

Компьютерное зрение:
- Семантическая сегментация - алгоритм распознает предметы на двухмерном изображении.
- Классификация изображений - классификация большого количества изображений по различным параметрам и критериям выборки.
- Обнаружение объекта - это технология позволяющая на изображениях или потоках видео обнаруживать семантические объекты, например людей, животных, автомобилей, велосипедистов и т. д.
- Генерация изображений - синтез новых изображений из существующего набора данных, например состарить лицо человека или наоборот, изменить пол и многое другое.
- Оценка позы  - одна из самых проблемных задач, когда по изображения необходимо определить позу предмета.

Обработка естественного языка:
- Машинный перевод - это перевод оригинального предложения или текста на другой целевой язык.
- Языковое моделирование - это прогнозирование следующего слова в предложении.
- Ответ на вопрос - в прямом смысле это формирование ответа на любой вопрос.
- Анализ настроения - задача нахождения полярности настроения заданного текста.
- Обработка естественного языка - это решение задачи, является ли гипотеза истинной, ложной или неопределенной при некоторой предпосылке, например круги Эйлера.

Медицина:
- Сегментация медицинских изображений - это решение задачи сегментирования объектов, представляющих интерес в медицинском изображении, например органов или их поражений.
- Обнаружение наркотиков - это решение задачи определение наркотиков среди новых лекарственных средств.
- Сегментация поражения - это сегментация повреждений от других объектов на двумерных изображениях.
- Сегментация опухоли головного мозга - это решение задачи отделения опухоли от других артефактов головного мозга при МРТ.
- Генерация медицинского изображения - является задачей синтеза новых медицинских изображений из существующего набора.

Методология:
- Вложение слов - это набор методов моделирования и изучения языка при обработке, где слова или фразы из словаря складываются в векторы действительных чисел.
- Репрезентация обучения - обучение алгоритмов машинного обучения для изучения полезных представлений, например тех, которые имеют скрытые характеристики или могут использоваться для трансферного обучения.
- Передача обучения - метод при котором веса связей одной модели ИНС, обученной определенной задаче, берутся и используются либо для построения экстрактора с фиксированными характеристиками, либо в качестве инициализации веса и/или точной настройки. (Один из методов который я буду использовать в ИНС архитектора)
- Адаптация домена - задача адаптации моделей между доменами, например движение робота от холодильника к хозяину.
- Многоцелевое обучение - решение направленно на одновременное изучение нескольких различных задач с максимальной эффективностью при выполнении одной или всех задач. (Основной метод который я буду использовать в ИНС архитектора)

Разнообразие:
- Рекомендации системы - задача составить список рекомендаций для пользователя.
- Совместная фильтрация - это система рекомендаций, которая использует прошлое поведение пользователя, а так же аналогичные решения, принимаемые другими пользователями.
- Причинный вывод - задача сделать вывод о причинно-следственной связи, основанной на условиях возникновения эффекта.
- Прогнозирование рейтинга кликов - решение задачи прогнозирования вероятности того, что что-то на сайте или рекламе будет нажато.
- Многорукие бандиты - задача, в которой фиксированное количество ресурсов должно быть распределено между конкурирующими ресурсами, что максимизирует ожидаемый выигрыш. (Увы пока недоступно на рекламных площадках, только АВ-тесты)

Речь:
- Распознавание речи - распознавание речи в аудио и преобразование ее в текст.
- Синтез речи - генерация речи в аудио поток из текста. ( я использую API Amazon Polly)
- Проверка диктора - проверка личности человека по характеристикам голоса.
- Поиск ключевых слов - определение ключевых слов в высказываниях.
- Улучшение речи - при наличии шума, улучшение речевого вывода.

Игры:
- Непрерывный контроль
- Стратегии в реальном времени
- Карточные игры 

Диаграммы:
- Прогноз связи - задача оценки вероятности связей между узлами на графике.
- Классификация узлов - задача, в которой алгоритм должен определять маркировку выборок (узлы), просматривая метки соседних узлов.
- Вложение графа - изучение отображение из сети в векторное пространство, сохраняя свойства сети.
- Обучение ранжированию - обучение взаимному продвижению.
- Обнаружение сообщества - социальные сети.

Роботы:
- Визуальная одометрия - преобразование элементов компьютерного зрения в геометрию.
- Навигация - определение положение агента в пространстве, за счет глубины сигнала датчиков.

В следующей части немного взглянем и пройдемся по структуре нейросети Phobos-а.

Комментариев нет:

Отправить комментарий

Поиск по этому блогу