Data mining

Ce este Data Mining:

Data mining este un termen englezesc legat de informatica a carei traducere este data mining . Se compune dintr-o funcționalitate care agregă și organizează date, găsind în ele modele, asocieri, modificări și anomalii relevante.

Termenul de exploatare a datelor a apărut pentru prima dată în 1990 în comunitățile de baze de date. Mineritul de date este etapa de analiză a procesului, cunoscută sub numele de KDD ( Knowledge Discovery in Databases ), traducerea literală fiind "Descoperirea cunoștințelor în baze de date".

Extracția de date poate fi împărțită în câțiva pași de bază: explorarea, construirea de modele, definiția modelului, validarea și verificarea.

Explorarea datelor este o practică relativ recentă în lumea computerelor și utilizează recuperarea informațiilor, inteligența artificială, recunoașterea modelelor și tehnicile statistice pentru a căuta corelații între diferite date care vă permit să obțineți cunoștințe benefice pentru o companie sau un individ. Pentru o companie, mineritul de date poate fi un instrument important care sporește inovația și rentabilitatea.

Utilizarea minelor de date este destul de comună în bazele de date mari, iar rezultatul final al utilizării acestora poate fi afișat prin reguli, ipoteze, arbori de decizie, dendrograme etc.

Exploatările de date bine executate trebuie să îndeplinească sarcini precum: detectarea anomaliilor, învățarea regulilor de asociere (modelarea dependenței), gruparea, clasificarea, regresia și sumarizarea. Procesul de extragere de date are loc, de obicei, folosind datele conținute în antrepozitul de date .

Există mai multe companii și programe software dedicate minelor de date, deoarece identificarea tiparelor în bazele de date este din ce în ce mai importantă. Cu toate acestea, identificarea standardelor relevante nu este unică pentru lumea calculatoarelor. Creierul uman folosește un proces similar pentru a identifica modelele și a dobândi cunoștințe.

În ultimii ani, exploatarea datelor a fost folosită pe scară largă în domeniile științei și ingineriei, cum ar fi bioinformatica, genetica, medicina, educația și ingineria electrică.

Conceptul de exploatare a datelor este adesea asociat cu extragerea informațiilor despre comportamentul oamenilor. Din acest motiv, în unele situații, extragerea datelor ridică probleme juridice și probleme legate de confidențialitate și etică. În ciuda acestui fapt, mulți oameni susțin că miningul de date este neutru din punct de vedere etic, deoarece nu are implicații etice.

Exemple de exemple minuite de date

Exploatarea datelor este adesea folosită de companii și organizații pentru a obține cunoștințe despre utilizatori / angajați / clienți. De exemplu, în sectorul public este posibil să se verifice între starea civilă a unui angajat și salariul pe care îl câștigă pentru a vedea dacă aceasta are o influență asupra vieții sale conjugale.

Companiile, cum ar fi lanțurile de supermarketuri, pot utiliza aceste date încrucișate pentru a determina produsele achiziționate împreună. Dacă un client care cumpără produsul X cumpără și produsul Y, poate fi o idee bună să poziționați cele două produse din apropiere pentru a le face mai ușor cumpărătorului.