Конволюционните невронни мрежи (CNN) са проектирани за първи път с цел разпознаване на изображения в областта на компютърното зрение. Тези мрежи са специализиран вид изкуствена невронна мрежа, която е доказала своята висока ефективност при анализиране на визуални данни. Развитието на CNN беше продиктувано от необходимостта да се създадат модели, които биха могли точно да класифицират и категоризират изображения, и техният успех в тази област доведе до широкото им използване в различни други приложения като откриване на обекти, сегментиране на изображения и дори обработка на естествен език.
CNN са вдъхновени от структурата и функционалността на зрителния кортекс в човешкия мозък. Подобно на зрителната кора, CNN се състоят от множество слоеве от взаимосвързани неврони, които обработват различни аспекти на входните данни. Ключовата иновация на CNN се крие в способността им автоматично да научават и извличат подходящи характеристики от изображения, елиминирайки необходимостта от ръчно проектиране на функции. Това се постига чрез използването на конволюционни слоеве, които прилагат филтри към входното изображение, за да открият различни визуални модели и характеристики, като ръбове, ъгли и текстури.
Първият пробив в CNN дойде с въвеждането на архитектурата LeNet-5 от Yann LeCun et al. през 1998 г. LeNet-5 беше специално проектиран за разпознаване на ръкописни цифри и постигна забележителна производителност на набора от данни MNIST, набор от данни за сравнение, широко използван за оценка на алгоритми за разпознаване на изображения. LeNet-5 демонстрира силата на CNN при улавянето на йерархични характеристики от изображения, позволявайки точна класификация дори при наличието на вариации в мащаба, ротацията и транслацията.
Оттогава насам CNN са се развили значително, като са разработени по-дълбоки и по-сложни архитектури. Един забележителен напредък беше въвеждането на архитектурата AlexNet от Alex Krizhevsky et al. през 2012 г. AlexNet постигна пробив в класификацията на изображения, като спечели ImageNet Large Scale Visual Recognition Challenge (ILSVRC) със значително по-нисък процент грешки в сравнение с предишни подходи. Този успех проправи пътя за широкото приемане на CNN в задачите за разпознаване на изображения.
CNN също са успешно приложени към други задачи за компютърно зрение. Например при откриване на обекти CNN могат да се комбинират с допълнителни слоеве за локализиране и класифициране на обекти в изображение. Известната регионално базирана конволюционна невронна мрежа (R-CNN), въведена от Ross Girshick et al. през 2014 г. е пример за такава архитектура. R-CNN постигна най-съвременни резултати при тестове за откриване на обекти, като използва силата на CNN за извличане на функции и го комбинира с методи за предлагане на региони.
Конволюционните невронни мрежи за първи път са проектирани за задачи за разпознаване на изображения в областта на компютърното зрение. Те направиха революция в областта чрез автоматично научаване на съответните функции от изображения, елиминирайки необходимостта от ръчно проектиране на характеристики. Развитието на CNN доведе до значителен напредък в класифицирането на изображения, откриването на обекти и различни други задачи за компютърно зрение.
Други скорошни въпроси и отговори относно EITC/AI/ADL Разширено задълбочено обучение:
- Защо трябва да прилагаме оптимизации в машинното обучение?
- Кога се получава свръхобувката?
- Могат ли конволюционните невронни мрежи да обработват последователни данни чрез включване на навивания във времето, както се използва в моделите Convolutional Sequence to Sequence?
- Разчитат ли Generative Adversarial Networks (GAN) на идеята за генератор и дискриминатор?