Wordpress og arbejde med big data!

jo l�ngere frem vi er kommet i tiden jo mere har folk brugt internettet og dermed ogs� udledt langt st�rre m�ngder data end nogensinde f�r hvor i bare de seneste 2 �r er 90% af alt data vi har p� internettet skabt. Big data kan v�re ret sv�rt at forholde sig til da det netop g�r ud p� at det er noget du ikke rigtigt kan beskrive eller m�le da m�ngden er s� k�mpe stor at man ikke engang kan n� at bearbejde alt dataen. det er en stor branche alene i at udvikle nye metoder at bearbejde de her k�mpe m�ngder data hurtigere, mere effektivt og grundigere for at f� den st�rste v�rdi ud af det data man modtager. Big data kan beskrives med de 5 ord: Velocity, Volume, Value, Variety, Veracity. Hver af de ord beskriver hvordan du bruger big data, oplysninger om din big data og nogle af udfordringerne med det.

Velocity er i bund og grund bare om hastigheden der bliver skabt nyt data hvilket kan v�re hvor mange beskeder eller interaktioner der sker p� platformene. volume minder meget om det da det ligesom velocity beskriver en m�ngde af det data du har at arbejde med. Value er meget om hvad for noget data du har, hvor stor en m�ngde og hvor godt du kan sortere og udnytte dataen for at f� bedst muligt v�rdi ud af den. variety er hvor forskelligt data du har hvilket kan v�re en hj�lp hvis et marked g�r d�rligt i perioder s� har du en helt anden platform at have data fra. Veracity er hvor god data du har og om det kan stoles p� hvilket kan �ge v�rdien meget da det s� vil kunne udnyttes meget bedre.

 

 En af de firmaer som har potentiale for big data er en cms til hjemmesider kaldet wordpress. Wordpress er af en s� stor st�rrelse at ca 75,000,000 hjemmesider er bygget op omkring wordpress hvilket er estimeret til at svare til ca 34 procent af hele internettet selvom det vil v�re umuligt at nogen sinde kunne estimere ordentligt. populariteten af wordpress h�nger sammen med den m�de det er bygget op som en m�de alle kan lave en simpel hjemmeside men samtidig ogs� giver dig adgang til at �ndre hver en lille detalje enten med kode eller plugins s�dan s� det er noget der kan bruges af alle. Det er ogs� en af de firmaer der stadig er i fremgang sammen med det voksende netv�rk og ogs� aktivt afholder over 600 camps om wordpress kodning over hele kloden.

Med 75,000,000 hjemmesider vil volumen af dataen v�re ut�nkelig stor da hver eneste hjemmesider f�rst og fremmest har alle sine undersider men ogs� har crash log�s, analytics og nogen endda interagere med brugeren hvilket g�r at alle hjemmesiderne lave de her k�mpe m�ngder data som med teknologien nu aldrig ville kunne v�re muligt p� et enkelt site. Det der g�r wordpress s� smart er s� at den her k�mpe m�ngde data er fordelt ud p� en masse mindre sider som hver is�r har deres egen hosting eller serverplads til at kunne lave de her analyser og sortering selv for at fjerne presset fra bare et knudepunkt.

al den her data kommer ogs� med en k�mpe velocity som kun vokser som wordpress siderne udvikler sig og udvider sig som aldrig f�r set, hvert sekund bliver der sendt mails, server requests og fejlkoder som alt sammen skal analyseres, sorteres og bruges hvor alt sammen skal ske med k�mpe hastigheder for ikke at �del�gge brugeroplevelsen og stadigv�k kunne beholde og bearbejde sin data.

en af de meget vigtige ting med dataen fra wordpress er den k�mpe variety af data. dette sker da wordpress er et system som bliver brugt af alle og derfor ogs� har hjemmesider i alle afskygninger lige fra de helt simple brug til det h�jteknologiske hjemmesider. det forskellige data kan f.eks. v�re at andre platforme generelt har en type brugere hvor wordpress har hjemmesider med lavteknologiske projekter som strikning men ogs� sociale medier, webshops og andre forskellige nicher.

veracity handler mere om det individuelle site end wordpress som helhed. Generelt kan man jo sige at hvis et registreret firma l�gger artikler og lignende op is�r omhandlende sig selv vil chancen for trov�rdighed v�re meget stor. der er dog ogs� mange hjemmesider som skoleprojekter og hjemmesider genereret af scammere og trolls hvor vi i de tilf�lde vil f� meget trov�rdige data. der vil selvf�lgelig altid v�re noget der vil slippe igennem spam filtre men efterh�nden er de blevet meget gode og trov�rdige.

med alt den her Big data kommer der en k�mpe value da de individuelle sider og wordpress f�r adgang til personlige og offentligt data om t�t p� alle i hele verden. Det der g�r wordpress�s data s� v�rdifuldt er n�rmest en blanding af alle v�erne Da vi har en k�mpe m�ngde data som kan analyseres og bruges over hele verden vi har ogs� en k�mpe variation i den data da hjemmesiderne handler om alt muligt forskelligt og trov�rdigheden kan meget hurtigt sorteres i n�r man vil l�re stille og roligt hvilke sider der er mere trov�rdige end andre.

Alt i alt er wordpress en fantastisk platform for big data da de har et k�mpe bredt netv�rk som kan indsamle data og samtidig ogs� have mange af midlerne til at gennemarbejde den data s� det bliver brugbart. der er mange firmaer der kan have interesse i data som det her. Hvis man starter med en simpel virksomhed med annoncer, vil google ads jo have en k�mpe platform hvor de altid vil kunne finde en hjemmeside at vise de ads p� som de forskellige brugere er interesseret i