Podrobnosti studentského projektu

Seznam
Téma:Popis vizuálních scén pomocí přirozeného jazyka - implementace do robota Pepper
Katedra:Katedra kybernetiky
Vedoucí:Michal Vavrečka
Vypsáno jako:Diplomová práce, Bakalářská práce, Semestrální projekt
Popis:Vytvořte systém, který dokáže zpracovat vizuální informaci z kamer robota a odpovídat na dotazy v přirozeném jazyce, tykající se vlastností a vztahů v obraze. Implentujte do humanoidního robota Pepper a otestujte.
Literatura:Johnson, J., Hariharan, B., van der Maaten, L., Fei-Fei, L., Zitnick, C. L., & Girshick, R. (2017, July). CLEVR: A diagnostic dataset for compositional language and elementary visual reasoning. In Computer Vision and Pattern Recognition (CVPR), 2017 IEEE Conference on (pp. 1988-1997). IEEE.
Shekhar, R., Pezzelle, S., Klimovich, Y., Herbelot, A., Nabi, M., Sangineto, E., & Bernardi, R. (2017). FOIL it! Find One mismatch between Image and Language caption. arXiv preprint arXiv:1705.01359.
Za obsah zodpovídá: Petr Pošík