This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
projects:hadoop [2009/08/21 02:39] vlad |
projects:hadoop [2009/08/23 19:25] vlad |
||
---|---|---|---|
Line 11: | Line 11: | ||
** se identifica cele mai iubite subiecte si cele mai urate subiecte legate de facultatea de calculatoare | ** se identifica cele mai iubite subiecte si cele mai urate subiecte legate de facultatea de calculatoare | ||
- | * veniti | + | * identificarea automata a participantilor potentiali in initiativele din facultate / in proiectele open source |
+ | ** se identifica cuvinte cheie pentru proiect | ||
+ | ** se cauta pe motoarele de cautare bloguri care contin grupuri din cuvinte cheie de mai sus | ||
+ | ** se agrega datele obtinute (information retrieval) | ||
+ | ** si se calculeaza scoruri pentru fiecare candidat (algoritmi de scoring, machine learning) | ||
+ | ** se extrag datele de contact ale candidatilor si se prezinta intr-o interfata | ||
+ | ** feature: incercarea stabilirii unor relatii de " | ||
+ | ** feature: scoring al activitatilor persoanei (daca are multe posturi pe blog/multe commit-uri pe github/ | ||
+ | |||
+ | * search engine care sa identifice persoanelor care te pot indruma cand ai o problema | ||
+ | ** am o problema cu softul open-source X, pe cine intreb - si search engine-ul sa-ti returneze persoana pe care ar trebui s-o intrebi si sa ai sanse maxime sa-ti raspunda. Unul dintre smoke tests e ca pentru "linux kernel" | ||
+ | ** mult crawling peste proiectele open-source existente, agregare de date si mult information retrieval |