Day 12:物體偵測(Object Detection) + 影像標題(Image ... | instance segmentation中文
圖.影像標題(ImageCaptioning),圖片來源:cs231n_2017_lecture11DetectionandSegmentation[1]前言影像辨識的發展,可以從ImageNetILSVRC挑戰賽(LargeScaleVisualRecognitionChallenge)題目一窺端倪,2011年[2]題目為影像分類(Classification)、影像分類及定位(ClassificationwithLocalization),到了2017年[3]題目為物體定位(ObjectLocalization)、物體偵測(ObjectDetection)、影片物體偵測(ObjectDetectionfromVideo),就可以了解整個技術的演進,我們看看下圖,電腦視覺的應用概分為下列幾類:分類(Classification)按語意切割(Sema...
圖. 影像標題(Image Captioning),圖片來源:cs231n_2017_lecture11 Detection and Segmentation[1]
前言影像辨識的發展,可以從 ImageNet ILSVRC 挑戰賽(Large Scale Visual Recognition Challenge)題目一窺端倪,2011年[2]題目為影像分類(Classification)、影像分類及定位(Classification with Localization),到了2017年[3]題目為物體定位(Object Localization)、物體偵測(Object Detection)、影片物體偵測(Object Detection from Video),就可以了解整個技術的演進,我們看看下圖,電腦視覺的應用概分為下列幾類:
分類(Classification) 按語意切割(Semantic Segmentation):按事物類別區分像素分塊,不區分『實例』(Instance)。 定位(Classification + Localization):標註單一物體(Single Object)所在的位置及大小。 物體偵測(Object Detection):標註多個物體(Multiple Object)所在的位置及大小。 實體切割(Instance Segmentation):標註『實例』(Instance),同一類的物體可以區分各別的位置及大小,尤其物體之間有重疊。圖. 除了分類(Classification),其他電腦視覺的應用,圖片來源:cs231n_2017_lecture11 Detection and Segmentation[4]之前在『Day 10:CNN 應用 -- 找出相似的照片[5]』一篇介紹如何找到我們如何找到相似的物體,問題再延伸一點,我們還要知道物體所在的位置及大小,進而把它標註出來,以利使用者迅速找到關注的物體,例如從監視器找嫌疑犯,如果能在每一幀(Frame)標註嫌疑犯,那警察抓嫌疑犯就方便多了。所以,我們就來看看怎麼實作。
相關技術實作的基礎還是應用『...