Back to Question Center
0

Semalt: Faqet e famshme të pathyeshëm

1 answers:

Për të korrigjuar të dhënat që dëshironi me dorë, ju duhet të keni aftësi të shkëlqyera programimi. Nga ana tjetër, mund të përdorni një sërë mjete për nxjerrjen e të dhënave të internetit që synojnë të lexojnë, strukturojnë dhe grumbullojnë të dhënat në një format të caktuar. Sidoqoftë, disa faqe interneti janë të papërpunuara, që do të thotë se ato përdorin teknikat anti-scraping ose rregullojnë rregullat e tyre. Për shembull, LinkedIn, Alibaba dhe Facebook kërkojnë detajet e identifikimit, ofrojnë të hyjnë në CAPTCHA dhe bllokojnë adresat IP për të siguruar mbrojtjen dhe privatësinë e përdoruesve të tyre.

1 - tappeti di medie dimensioni scontati. Facebook:

Facebook është një nga faqet më të famshme të rrjeteve sociale që ka mbi 20 milionë përdorues aktiv në të gjithë botën. Ka një numër të madh aplikimesh dhe programesh për grumbullimin e të dhënave që synojnë nxjerrjen e informacionit individual nga Facebook. Për fat të keq, shumica e mjeteve nuk na japin të dhëna të sakta dhe të lexueshme. Facebook e ka bërë të vështirë për spammers dhe hakerët që të mbledhin informacion rreth përdoruesve të tij. Ajo mund të merret vetëm me ndihmën e një parser HTML si Python, por shumica e webmasters dhe përkthyes të pavarur nuk e di edhe bazat e Python. Kohët e fundit, një karierë Facebook u lançua për të nxjerrë informacione vitale nga ky uebfaqe e rrjeteve sociale. Me një kruajtës në Facebook, mund të grumbulloni vetëm emrat dhe adresat e emailit të përdoruesve të Facebook. Por nëse doni të grumbulloni të dhëna në thellësi, nuk mund ta përdorni këtë vegël ose ndonjë kruajtës tjetër të ngjashëm.

2. LinkedIn:

LinkedIn është një tjetër faqe interneti e rrjeteve sociale që është e pamundur të hall. Megjithatë, pjesërisht mund të ekstraktoni të dhëna nga disa faqe web, por shumica e informacionit është e paarritshme. Ju mund të grisni informacionin nga një profil publik i LinkedIn duke përdorur Importin. io ose Kimono Labs. Marketers nuk mund të përfitojnë nga shërbimet e scraping për shkak të masave të forta të sigurisë LinkedIn. Megjithatë, ata kanë filluar përdorimin e Lead Extractor, që ndihmon në kapjen e profileve publike. Ky mjet mund të veçojë lidhjet e profilit, emrat dhe adresat e postës. Por nëse doni të merrni ID Skype, Yahoo Messenger ID, adresë të plotë dhe ID Twitter të një përdoruesi, LinkedIn nuk do t'ju lejojë të bëni atë.

3. Alibaba:

Alibaba është një konglomerat i teknologjisë që siguron shërbime biznesi për konsumatorin në internet. Për fat të keq, nuk ka asnjë mënyrë për të kapur të dhënat nga kjo faqe interneti. Ndryshe nga Amazon dhe eBay, Alibaba e ka bërë të vështirë për përdoruesit e tij të nxjerrin informacion rreth produkteve, imazheve, përshkrimit dhe çmimeve të saj. Në vitin 2015, një numër i mjeteve që mund të fshijnë të dhënat nga Alibaba me lehtësi u prezantuan tek publiku. Shumica e mjeteve paguhen dhe nuk i plotësojnë pritjet e startupeve. Alibaba operon një grup të gjerë të bizneseve në të gjithë botën dhe lidh blerësit me furnizuesit. Ndërkohë, ajo siguron privatësinë e tyre dhe nuk lejon që dikush të gërmoj të dhënat. Që nga tetori 2017, Alibaba ka më shumë se 500 milionë përdorues aktivë mujorë në platformën e saj. Alibaba madje tejkalonte lojtarët më të mëdhenj si Google, Google dhe Microsoft në rritjen e të ardhurave nga cloud. Ajo ka zbatuar strategjitë më të mira për të siguruar privatësinë e furnitorëve të saj dhe bllokon të gjitha adresat IP të dyshimta brenda disa sekondave.

December 22, 2017