Seznam

Téma:Škálování clusteru Hadoop v cloudu / správa NoSQL, programování
Vedoucí:Ing. Tomáš Vondra Ph.D.
Vypsáno jako:Diplomová práce,Individuální projekt
Popis:Hadoop is one of the most promising technologies for batch computing. However, it is designed to run on standalone clusters, not scalable infrastructure. Scaling down is difficult due to random block replication in HDFS. Scaling up and suspending already done on VMware. We want to port the Serengeti project to other private clouds and add downward scaling. It contains Chef and Ironfan inside.
Pokyny:Projekt: Nastudujte architekturu systému Hadoop, zvláště vrstvy HDFS. Analyzujte možnosti jeho nasazení v cloudu. Prozkoumejte projekty VMware Serengeti a OpenStack Savanna.

DP: Navrhněte způsob, jak škálovat systém Hadoop v cloudu (zvláště směrem dolů) tak, aby byla zachována konzistence dat a při dodržení stanovené doby do dokončení úloh. Implementujte Vaše řešení nebo jej přidejte do existujícího projektu. Implementaci otestujte na dodaném cloudu (půjde o OpenNebula v Metacentrum CESNET, datové centrum CERIT-SC, ke kterému ještě takový plugin neexistuje).
Realizace:Analýza, vlastní implementace nebo přispění do open source
Vypsáno dne:04.06.2014