This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
projects:hadoop [2009/08/10 17:31] razvan created |
projects:hadoop [2009/08/23 19:25] vlad |
||
---|---|---|---|
Line 5: | Line 5: | ||
== Idei de proiecte == | == Idei de proiecte == | ||
+ | * evaluare pareri despre facultatea de calculatoare | ||
+ | ** se pleaca de la posturile de pe planet.cs.pub.ro, | ||
+ | ** se identifica subiectul principal din fiecare post si apropierea lui de facultatea de calculatoare (algoritm de machine learning) | ||
+ | ** se masoara gradul de simpatie/ | ||
+ | ** se identifica cele mai iubite subiecte si cele mai urate subiecte legate de facultatea de calculatoare | ||
+ | |||
+ | * identificarea automata a participantilor potentiali in initiativele din facultate / in proiectele open source | ||
+ | ** se identifica cuvinte cheie pentru proiect si cuvinte cheie pentru requirements-urile fiecarui rol din proiect | ||
+ | ** se cauta pe motoarele de cautare bloguri care contin grupuri din cuvinte cheie de mai sus | ||
+ | ** se agrega datele obtinute (information retrieval) | ||
+ | ** si se calculeaza scoruri pentru fiecare candidat (algoritmi de scoring, machine learning) | ||
+ | ** se extrag datele de contact ale candidatilor si se prezinta intr-o interfata | ||
+ | ** feature: incercarea stabilirii unor relatii de " | ||
+ | ** feature: scoring al activitatilor persoanei (daca are multe posturi pe blog/multe commit-uri pe github/ | ||
+ | |||
+ | * search engine care sa identifice persoanelor care te pot indruma cand ai o problema cu un soft open source | ||
+ | ** am o problema cu softul open-source X, pe cine intreb - si search engine-ul sa-ti returneze persoana pe care ar trebui s-o intrebi si sa ai sanse maxime sa-ti raspunda. Unul dintre smoke tests e ca pentru "linux kernel" | ||
+ | ** mult crawling peste proiectele open-source existente, agregare de date si mult information retrieval |