Записная книжка

Компьютерное зрение, машинное обучение, нейронные сети и т.п.

Mask R-CNN

Разберём статью [1], в которой описана сеть, решающая задачу сегментации экземпляра объекта (object instance segmentation). Авторы предлагают сеть, которую они назвали Mask R-CNN. Mask R-CNN берёт за основу Faster R-CNN и добавляет к ней дополнительную ветвь. Эта ветвь на выходе должна выдать маску объекта в дополнение к ограничивающему прямоугольнику и классу.

Читать дальше...

Алгоритмы оптимизации типа градиентного спуска

При тренировки нейронной сети применяются различные алгоритмы оптимизации, большинство из них являются усовершенствованием стохастического градиентного спуска, хочется иметь их все (про которые я знаю) на одной странице.

Читать дальше...

Генеративно-состязательная сеть

Генеративно-состязательная сеть (Generative adversarial network) это методика обучения пары моделей:

  1. генеративной $G$, которая по случайному шуму генерирует данные, подчинённые некоторому вероятностному распределению, и

  2. дискриминативной $D$, которая приписывает, поступающим на её вход данным, вероятность того, что они получены из тренировочного датасета или сгенерированы моделью $G$.

Т.е. модель $G$ обучается таким образом, чтобы максимизировать вероятность того, что $D$ ошибётся. А модель $D$ тренируется отличать подмену реальных данных от тех, которые сгенерировала сеть $G$. Таким образом мы получаем как бы игру для двух игроков.

Читать дальше...

R-CNN, Fast R-CNN, Faster R-CNN etc.

Возвращаемся к задаче детектирования объектов на изображении. Один из подходов к решению данной задачи был рассмотрен, когда разбирали сеть OverFeat. В данном тексте разберем конструкцию, которая впервые была предъявлена в статьях [1] и [2], а затем усовершенствована в статьях [3] и [4].

Читать дальше...