Pravda24  |  MyMuži  |  VipShow  |  HobbyDeník  |  ČasProŽeny  |  ByznysDeník  |  ČasProBydlení  |  NeposlušnéTlapky  |  MotorGuru  |  TechSvět

Přispívat do fóra mohou pouze pravidelní uživatelé Roumingu.

Zobrazení je omezeno na jedno vlákno! Vrátit se k zobrazení všech vláken.

 

re: Web scraping, web crawlers (antonymRP (25.5.2015 8:43)
nelegalni? krome toho manika, co stahnul komplet JSTOR, nevim o zadnem pripadu, kde by za to byl nekdo stahnuty (a tam slo o to, ze to stahnul pres pristup sve univerzity a pak snad dokonce zverejnil)

@Colombo:
pokud chces stahovat data fakt nahodne z internetu, tak na to imho nic neexistuje (jak identifikovat to, co konkretne hledas? atd). Kdyz mas konkretni web, ze ktereho chces neco vyzobat, tak asi to Mechanize jak zminuje mi0
 
re: Web scraping, web crawlers (anonymousseRP (25.5.2015 8:39)
není to takhle náhodou ilegální? =)
 
re: Web scraping, web crawlers (mi0RP (25.5.2015 8:13)
Ja to robím s RUBY + Mechanize a viac nepotrebujem :)
 
re: Web scraping, web crawlers (ColomboRP (25.5.2015 7:16)
Nejde o to, že nutně chci s něčím pomoct (ačkoliv to by se taky hodilo), jde o to, že mi ta problematika vlastně přijde zajímavá a když už sem na to narazil, rád bych se přiučil.
 
re: Web scraping, web crawlers (vecernikRP (25.5.2015 7:08)
Jo. Delal jsem v minulosti hodne ale spis na tvorbu statistik (miss leta z Blesku, vyvoj ceny jidel v menzach, kompletni seznam hracu a jejich vlastnosti na wow serveru, parsovani RUIAN XML)
Kazdopadne vsecky tyhle veci jsou hodne specificke. Stejne jako tvoje pozadavky.
 
Web scraping, web crawlers (ColomboRP (25.5.2015 5:53)
Dělal někdo? Trochu si o tom čtu a připadá mi, že to je naprosto skvělý způsob jak získat hromadu sociálních dat. Máte s tím někdo zkušenosti? Celkem mě to zajímá.

Osobně sem teď řešil problém jak se dostat k antropologickým datům, která jsou rozeseta různě po internetu, v článcích, knihách atp., a ne v jednotné databázi, kterou z toho vytvářím.

Původně sem chtěl použít google api, jenže jak sem se dozvěděl, v custom api google search používá naprosto jiné indexování, takže to, co sem hledal, mělo v custom search api naprosto rozdílné výsledky než skrze prohlížeč. Tedy jsem nucen používat Bing (limit je dokonce větší). Jenže chybí mi něco, co by nahradilo google scholar, abych si mohl prohlídnout i něco z akademických prací.
 
 


Tento web používá k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Podmínky pro uchovávání nebo přístup ke cookies je možné nastavit ve vašem prohlížeči. Více...