Proiecte legate de hadoop

Idei de proiecte

evaluare pareri despre facultatea de calculatoare
- se pleaca de la posturile de pe planet.cs.pub.ro, urmand ca sursele sa se diversifice
- se identifica subiectul principal din fiecare post si apropierea lui de facultatea de calculatoare (algoritm de machine learning)
- se masoara gradul de simpatie/apatie (algoritm de machine learning)
- se identifica cele mai iubite subiecte si cele mai urate subiecte legate de facultatea de calculatoare

search engine care sa identifice persoanelor care te pot indruma cand ai o problema cu un soft open source
- am o problema cu softul open-source X, pe cine intreb - si search engine-ul sa-ti returneze persoana pe care ar trebui s-o intrebi si sa ai sanse maxime sa-ti raspunda. Unul dintre smoke tests e ca pentru “linux kernel” trebuie sa raspunda “Linux Torvalds” si sa-ti dea adresa lkml :))
- mult crawling peste proiectele open-source existente, agregare de date si mult information retrieval