Giorgos Tolias, Ph.D. presents Habilitation lecture - Ranking on Manifolds for Visual Search and Object Discovery
On 2022-12-14 13:00:00 at Technická 2, Praha 6, místnost T2:D3-209
Habilitation lecture of dr. Giorgos Tolias at the Scientific Council meeting -
Ranking on Manifolds for Visual Search and Object Discovery
The link to follow the lecture on you tube is here:
https://www.youtube.com/playlist?list=PLQL6z4JeTTQlCmnn476bHdbeUatwKg7db
Abstract:
Machine-extracted representation of image content is used in computer vision to
help estimate visual similarity, i.e. the degree of relevance between objects or
scenes shown in two images. This is an essential part of many computer vision
methods and applications. The ability to automatically estimate visual
similarity allows to perform content-based visual search within large image
collections and, consequently, to transfer and extend existing knowledge. When
objects look similar to each other, humans tend to group them and also think
they have similar properties, purpose, and functionality. In addition to humans,
the same holds for machines; automatic discovery of object relations enables
ways to infer about previously unseen objects.
The habilitation thesis describes the author's journey in computer vision
encapsulated as a cyclic process between visual representation, visual
similarity, visual search, and object discovery. The habilitation talk focuses
on the use of approaches that exploit automatically extracted relations within
large unordered image collections to improve visual search and to perform object
discovery. The result of such a discovery process can enable organization and
browsing of online or personal collections of visual content, but most
importantly it forms the input to other computer vision tasks that involve
learning. Specifically, this is a valuable process for training data hungry
models such as deep neural networks; the automatically obtained relations allow
to perform training with limited or no supervision in tasks such as
representation learning and object classification.
Habilitační přednáška a obhajoba habilitační práce před vědeckou
radou fakulty na téma: Ranking on Manifolds for Visual Search and Object
Discovery.
Strojově získaná reprezentace vizuálního obsahu v obrazech i videích se v
počítačovém vidění využívá k odhadu vizuální podobnosti. Zatímco
lidské vnímání toho, zda si jsou či nejsou různé objekty a scény
podobné, ovlivňují faktory jako tvar, textura, uspořádání, barva či
pohyb, vizuální rozpoznávání stroji mnohdy závisí na odhadu vizuální
podobnosti.
Hlavním předmětem habilitační práce Giorgose Toliase ze skupiny
vizuálního rozpoznávání na katedře kybernetiky FEL ČVUT je strojové
párování různých objektů stejných fyzických entit. Jde například o
dva
pohledy na jeden objekt nebo přírodní lokalitu či různé zástupce
stejného druhu zvířat, rostlin nebo typu přístrojů – například dvě
sovy pálené nebo dvě kamery. Tolias v rámci svého výzkumu studuje
možnosti nových postupů pro návrhy a učení univerzálních modelů k
rozpoznávání, porovnávání a vyhledávání různých objektů, které by
vyžadovaly menší míru supervize, což by zjednodušilo jejich vývoj.
Výsledky výzkumu mohou najít využití v ochraně autorských práv,
rozpoznávání konkrétních uměleckých děl v rámci větších on-line
sbírek, komerčních produktů, ale i strojového rozpoznávání jemných
rozdílů v lidských činnostech či mezi zvířaty a rostlinami, což může
být využito v různých typech přístrojů a techniky.
Přenos pro veřejnost na you tube
https://www.youtube.com/playlist?list=PLQL6z4JeTTQlCmnn476bHdbeUatwKg7db
Kontaktní osoba: Helena Weigelová, weigelo@fel.cvut.cz, 224 353 934
https://fel.cvut.cz/cz/vr/
Ranking on Manifolds for Visual Search and Object Discovery
The link to follow the lecture on you tube is here:
https://www.youtube.com/playlist?list=PLQL6z4JeTTQlCmnn476bHdbeUatwKg7db
Abstract:
Machine-extracted representation of image content is used in computer vision to
help estimate visual similarity, i.e. the degree of relevance between objects or
scenes shown in two images. This is an essential part of many computer vision
methods and applications. The ability to automatically estimate visual
similarity allows to perform content-based visual search within large image
collections and, consequently, to transfer and extend existing knowledge. When
objects look similar to each other, humans tend to group them and also think
they have similar properties, purpose, and functionality. In addition to humans,
the same holds for machines; automatic discovery of object relations enables
ways to infer about previously unseen objects.
The habilitation thesis describes the author's journey in computer vision
encapsulated as a cyclic process between visual representation, visual
similarity, visual search, and object discovery. The habilitation talk focuses
on the use of approaches that exploit automatically extracted relations within
large unordered image collections to improve visual search and to perform object
discovery. The result of such a discovery process can enable organization and
browsing of online or personal collections of visual content, but most
importantly it forms the input to other computer vision tasks that involve
learning. Specifically, this is a valuable process for training data hungry
models such as deep neural networks; the automatically obtained relations allow
to perform training with limited or no supervision in tasks such as
representation learning and object classification.
Habilitační přednáška a obhajoba habilitační práce před vědeckou
radou fakulty na téma: Ranking on Manifolds for Visual Search and Object
Discovery.
Strojově získaná reprezentace vizuálního obsahu v obrazech i videích se v
počítačovém vidění využívá k odhadu vizuální podobnosti. Zatímco
lidské vnímání toho, zda si jsou či nejsou různé objekty a scény
podobné, ovlivňují faktory jako tvar, textura, uspořádání, barva či
pohyb, vizuální rozpoznávání stroji mnohdy závisí na odhadu vizuální
podobnosti.
Hlavním předmětem habilitační práce Giorgose Toliase ze skupiny
vizuálního rozpoznávání na katedře kybernetiky FEL ČVUT je strojové
párování různých objektů stejných fyzických entit. Jde například o
dva
pohledy na jeden objekt nebo přírodní lokalitu či různé zástupce
stejného druhu zvířat, rostlin nebo typu přístrojů – například dvě
sovy pálené nebo dvě kamery. Tolias v rámci svého výzkumu studuje
možnosti nových postupů pro návrhy a učení univerzálních modelů k
rozpoznávání, porovnávání a vyhledávání různých objektů, které by
vyžadovaly menší míru supervize, což by zjednodušilo jejich vývoj.
Výsledky výzkumu mohou najít využití v ochraně autorských práv,
rozpoznávání konkrétních uměleckých děl v rámci větších on-line
sbírek, komerčních produktů, ale i strojového rozpoznávání jemných
rozdílů v lidských činnostech či mezi zvířaty a rostlinami, což může
být využito v různých typech přístrojů a techniky.
Přenos pro veřejnost na you tube
https://www.youtube.com/playlist?list=PLQL6z4JeTTQlCmnn476bHdbeUatwKg7db
Kontaktní osoba: Helena Weigelová, weigelo@fel.cvut.cz, 224 353 934
https://fel.cvut.cz/cz/vr/