View on GitHub

ITMO-PE

My study notes about Program Engineering at University ITMO

MainPage/Computer Vision/Lecture

课程链接:开放教育

1. Введение. Предобработка изображений
介绍 图像预处理

1.0 О курсе 关于课程

Здравствуйте, уважаемые слушатели!
亲爱的听众朋友们大家好!

Добро пожаловать на курс «Компьютерное зрение».
欢迎来到计算机视觉课程。

В курсе рассматриваются основные задачи из области компьютерного зрения, вокруг которых сконцентрировано внимание научного сообщества и промышленности: задачи классификации, сегментации, детектирования объектов. В рамках данного курса изучаются наиболее распространенные современные методы решения рассматриваемых проблем.
该课程研究了计算机视觉领域的主要任务,科学界和工业界的注意力集中在这些任务上:分类、分割、对象检测问题。本课程探讨解决所考虑问题的最常见的现代方法。

АВТОР ОНЛАЙН-КУРСА:
在线课程作者:

Самарин Алексей Владимирович

1.1 Введение. Объект изучения. Процесс формирования изображения
简介 研究对象 成像过程

1.2 Повышение разрешения
超分辨率

1.3 Основные цветовые преобразования в составе комбинированной схемы коррекции цвета
基本颜色变换作为组合颜色校正方案的一部分

1.4 Дополнительные цветовые преобразования в составе комбинированной схемы коррекции цвета
作为组合色彩校正方案一部分的附加色彩变换

2. Классификация изображений
图像分类

2.1 Введение. Классические/не нейросетевые/общие методы для классификации изображений
经典/非神经网络/图像分类的通用方法

2.2 Классические/базовые дескрипторы изображений
经典/基本图像描述符

2.3 Основные конструктивные элементы нейросетевых классификаторов изображений
神经网络图像分类器的基本结构要素

2.4 Современные нейросетевые архитектуры классификации изображений
用于图像分类的现代神经网络架构

2.5 Основные методы оптимизации градиентного спуска
基本梯度下降优化技术

2.6 Функции потерь и метрики качества
损失函数和质量指标

3. Детектирование объектов

3.1 Введение. Классическая схема сканирующего окна для детектирования объектов
介绍。用于物体检测的经典扫描窗口设计

3.2 Глубокие нейросетевые архитектуры для детектирования объектов общего плана
用于检测一般物体的深度神经网络架构

3.3 Глубокие нейросетевые архитектуры для детектирования текстовых фрагментов на изображении
用于检测图像中文本片段的深度神经网络架构

3.4 Глубокие нейросетевые архитектуры для детектирования человеческих лиц
用于检测人脸的深度神经网络架构

3.5 Оценка качества детектирования
检测质量评估

4. Трекинг

4.1 Введение. Общая схема трекинга объектов. Базовые принципы распознавания движения в кадре
介绍 对象跟踪的一般方案 帧内运动识别的基本原理

4.2 Априорная локализация объектов.
对象的先验定位

4.3 Трекинг ключевых точек. Детектирование и дескрипторы ключевых точек
跟踪关键点 关键点检测和描述符

4.4 Трекинг на основе вычисления оптического потока
基于光流计算的跟踪

4.5 Глубокие нейросетевые архитектуры для трекинга объектов
用于对象跟踪的深度神经网络架构

5. Сегментация

5.1 Постановка задачи. Основные типы, принципы работы и устройство механизмов стереозрения
问题的表述。立体视觉机构的基本类型、工作原理和设计

5.2 Описание принципов работы стереопары в терминах проективной геометрии
用射影几何描述立体对的工作原理

5.3 Ректификация изображений. Карта расхождений и поиск глубины
图像校正。视差图和深度搜索

5.4 Алгоритмы стереосопоставления
立体匹配算法

6. Генерация изображений

6.1 Введение. Авторегрессионные модели генерации изображений
介绍 自回归图像生成模型

6.2 GANы и их проблемы
GAN 及其问题

6.3 Архитектуры на основе GANов
基于 GAN 的架构

6.4 VAE. Принцип работы VAE, reparameterization trick
VAE 的工作原理,重新参数化技巧

7. Конструирование признаков

7.1 Введение. Базовые контурные примитивы и алгоритмы их вычисления
介绍 基本轮廓基元及其计算算法

7.2 Комплексные контурные признаки. Понижение размерности. Признаки на основе ключевых точек
复杂的轮廓特征 降维 基于关键点的特征

7.3 Перцептивное хэширование
感知哈希

7.4 Нейросетевые дескрипторы. Feature engineering в общем пайплайне системы компьютерного зрения
神经网络描述符。计算机视觉系统通用流程中的特征工程

8. Stereo vision

8.1 Постановка задачи. Основные типы, принципы работы и устройство механизмов стереозрения
问题的表述 立体视觉机构的基本类型、工作原理和设计

8.2 Описание принципов работы стереопары в терминах проективной геометрии
用射影几何描述立体对的工作原理

8.3 Ректификация изображений. Карта расхождений и поиск глубины
图像校正 视差图和深度搜索

8.4 Алгоритмы стереосопоставления
立体匹配算法