This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
projects:hadoop [2009/08/23 19:19] vlad |
projects:hadoop [2020/07/20 09:16] (current) |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | = Proiecte legate de hadoop = | + | ====== Proiecte legate de hadoop |
- | * Participanți: | + | |
- | * Link: http:// | + | * Link: http:// |
- | == Idei de proiecte == | + | ===== Idei de proiecte |
- | * evaluare pareri despre facultatea de calculatoare | + | * evaluare pareri despre facultatea de calculatoare |
- | ** se pleaca de la posturile de pe planet.cs.pub.ro, | + | * se pleaca de la posturile de pe planet.cs.pub.ro, |
- | ** se identifica subiectul principal din fiecare post si apropierea lui de facultatea de calculatoare (algoritm de machine learning) | + | * se identifica subiectul principal din fiecare post si apropierea lui de facultatea de calculatoare (algoritm de machine learning) |
- | ** se masoara gradul de simpatie/ | + | * se masoara gradul de simpatie/ |
- | ** se identifica cele mai iubite subiecte si cele mai urate subiecte legate de facultatea de calculatoare | + | * se identifica cele mai iubite subiecte si cele mai urate subiecte legate de facultatea de calculatoare |
- | * identificarea automata a participantilor potentiali in initiativele din facultate / in proiectele open source | + | |
- | ** se identifica cuvinte cheie pentru proiect si cuvinte cheie pentru requirements-urile fiecarui rol din proiect | + | * se identifica cuvinte cheie pentru proiect si cuvinte cheie pentru requirements-urile fiecarui rol din proiect |
- | ** se cauta pe motoarele de cautare bloguri care contin grupuri din cuvinte cheie de mai sus | + | * se cauta pe motoarele de cautare bloguri care contin grupuri din cuvinte cheie de mai sus |
- | ** se agrega datele obtinute (information retrieval) | + | * se agrega datele obtinute (information retrieval) |
- | ** si se calculeaza scoruri pentru fiecare candidat (algoritmi de scoring, machine learning) | + | * si se calculeaza scoruri pentru fiecare candidat (algoritmi de scoring, machine learning) |
- | ** se extrag datele de contact ale candidatilor si se prezinta intr-o interfata | + | * se extrag datele de contact ale candidatilor si se prezinta intr-o interfata |
- | ** feature: incercarea stabilirii unor relatii de " | + | * feature: incercarea stabilirii unor relatii de " |
- | ** feature: scoring al activitatilor persoanei (daca are multe posturi pe blog/multe commit-uri pe github/ | + | * feature: scoring al activitatilor persoanei (daca are multe posturi pe blog/multe commit-uri pe github/ |
+ | |||
+ | * search engine care sa identifice persoanelor care te pot indruma cand ai o problema cu un soft open source | ||
+ | * am o problema cu softul open-source X, pe cine intreb - si search engine-ul sa-ti returneze persoana pe care ar trebui s-o intrebi si sa ai sanse maxime sa-ti raspunda. Unul dintre smoke tests e ca pentru "linux kernel" | ||
+ | * mult crawling peste proiectele open-source existente, agregare de date si mult information retrieval |