Ответ 1
Интересная проблема. Поскольку нет конкретного примера для работы, я только опишу алгоритмические подходы, которые я бы пробовал сам.
Подход №1: используйте плотные дескрипторы
- Вычислить плотные дескрипторы изображений (например, SIFT/HOG/Gabor или даже лучше использовать предварительно подготовленную глубокую сетку, например VGG).
- Возьмите дескрипторы из всех изображений только из аннотированных мест: у вас должны быть дескрипторы ~ 10K с метками класса. Настройте простой классификатор (например, SVM) на этом наборе.
- Вернитесь к изображениям: примените классификатор и выведите лог-вероятность для каждого пикселя, принадлежащего каждому из классов. Это должен быть унарный термин (иначе называемый "термин данных" ) для вырезания графа.
- Локально изменить унарный термин, чтобы заставить аннотированные точки принадлежать правому классу.
- Используйте простой парный термин (градиенты изображения или некоторый термин, основанный на краю).
- Примените Graph-Cut, чтобы получить семантическую сегментацию.
Подход №2: тренируйте собственную модель семантической сегментации
Для обучения полностью сверточной модели для сегментации вам необязательно иметь метки для всех пикселей. У вас может быть "ignore_label": пиксель, помеченный этой меткой, игнорируется и не вносит вклад в потерю.
Ваш случай - крайний случай "ignore_label" - у вас есть только ~ 60 пикселей, помеченных на изображение. Тем не менее, может быть интересно посмотреть, что вы можете узнать с такой разреженной информацией.
Подумав об этом, вы получите больше информации на изображение, чем только отмеченные точки:
В моем наборе данных имеется около 10 различных классов, каждое изображение, вероятно, имеет около 5 в среднем
Смысл в том, что если у изображения есть метки для классов 1..5, вы знаете, что он не содержит классов 6..10 (!) У вас может быть "положительный термин" в убытке, приписывая очень немногие помеченные пиксели вправо классов и отрицательный термин "для всех остальных пикселей, которые наказывают, если они назначены классам, которые вообще не присутствуют на изображении.