| mihaigrecu345 a întrebat:

Salut lume! Am nevoie de o lista, un dictionar in format text, xml sau csv care sa cuprinda cele mai uzuale cuvinte in limba romana. Imi trebuie pentru a programa aplicatii care au legatura cu criptografia.
Multumesc anticipat!
Mesaj pentru paranoici: Nu vreau sa sparg parole, mai simplu este sa cauti exploituri, mult mai rapid si eficient. Pentru asta exista chiar baze de date.

Răspuns Câştigător
Bula
| Bula a răspuns:

Ca idee:
In pachetele Office sunt incluse vocabularele pentru corectarea ortografica.
Descarca versiunea romana din Open Office sau Libre Office, cauta baza de date (fisierul) pentru corectare ortografica (si /sau de sinonime), de acolo poti descarca cele mai multe cuvinte. Poate va fi nevoie sa scrii o scurta rutina pentru prelucrare /extragere, dar este posibil sa gasesti codurile sursa (ambele fiind fiind Open Source).

6 răspunsuri:
| dienuta1990 a răspuns:

Https://www.efemeride.ro/cele-mai-folosite-cuvinte-din-limba-romana/ Pe acest site ai o lista cu cele mai folosite cuvinte din limba romana sper ca ti-am fost si de ajutor, macar putin.

Bula
| Bula a răspuns:

Probabil vei gasi diferite liste, in diferite formate.

Problema ta mai mare va fi TRATAREA DIACRITICELOR.
In format pur text NU ai diacritice, doar daca utilizezi si tabelele ASCII suplimentare (extinse).
De asemenea, in documente se folosesc diferite FONTURI pentru echivalare, pe internet sunt uzuale codificarile UNICODE, UTF-8, in alte sisteme codul EBCDIC etc. etc.

Ca urmare, va trebui sa identifici intai tipul de codificare, dupa care diaciriticele, sa le compari si cu versiunile fara diacritice (doar alfabetul englez).

Succes si rabdare multa! happy

| mihaigrecu345 explică (pentru Bula):

Multumesc mult! orice e bine venit!

| mihaigrecu345 explică (pentru dienuta1990):

Multumesc, apreciez, dar vreau cam 10.000 de cuvinte.

| mihaigrecu345 explică (pentru Bula):

Multumesc, la cat folosesc eu office-ul nu m-am gandit.

| Bogdan70001 a răspuns:

" Nu vreau sa sparg parole, mai simplu este sa cauti exploituri" pai si alea iti cer un wordlist laughing Ca in mare folosesc atacuri bruteforce folosindu-se de un wordlist.

Bine te cred ca nu vr sa faci asta (nici nu mai merge), dar am zis ca idee