Seznam

Téma:Popis vizuálních scén pomocí přirozeného jazyka - implementace do robota Pepper
Vedoucí:Michal Vavrečka; Garant:
Vypsáno jako:Diplomová práce,Bakalářská práce,Individuální projekt,Dobrovolná odborná práce,Semestrální projekt
Oponent:Karla Stepanova
Popis:Vytvořte systém, který dokáže zpracovat vizuální informaci z kamer robota a odpovídat na dotazy v přirozeném jazyce, tykající se vlastností a vztahů v obraze. Implentujte do humanoidního robota Pepper a otestujte.

Pokyny:Nastudujte oblast VQA
Implemetujte řešení o robota
Otestujte v reálných podmínkách
Literatura:Johnson, J., Hariharan, B., van der Maaten, L., Fei-Fei, L., Zitnick, C. L., & Girshick, R. (2017, July). CLEVR: A diagnostic dataset for compositional language and elementary visual reasoning. In Computer Vision and Pattern Recognition (CVPR), 2017 IEEE Conference on (pp. 1988-1997). IEEE. Shekhar, R., Pezzelle, S., Klimovich, Y., Herbelot, A., Nabi, M., Sangineto, E., & Bernardi, R. (2017). FOIL it! Find One mismatch between Image and Language caption. arXiv preprint arXiv:1705.01359.
Vypsáno dne:27.04.2018