Pravda24 | MyMuži | VipShow | HobbyDeník | ČasProŽeny | ByznysDeník | ČasProBydlení | NeposlušnéTlapky | MotorGuru | TechSvět |
re: Web scraping, web crawlers (antonym) RP (25.5.2015 8:43) ⇥ |
↻ |
nelegalni? krome toho manika, co stahnul komplet JSTOR, nevim o zadnem pripadu, kde by za to byl nekdo stahnuty (a tam slo o to, ze to stahnul pres pristup sve univerzity a pak snad dokonce zverejnil) @Colombo: pokud chces stahovat data fakt nahodne z internetu, tak na to imho nic neexistuje (jak identifikovat to, co konkretne hledas? atd). Kdyz mas konkretni web, ze ktereho chces neco vyzobat, tak asi to Mechanize jak zminuje mi0 |
|
re: Web scraping, web crawlers (anonymousse) RP (25.5.2015 8:39) ⇥ |
↻ |
není to takhle náhodou ilegální? | |
re: Web scraping, web crawlers (mi0) RP (25.5.2015 8:13) ⇥ |
↻ |
Ja to robím s RUBY + Mechanize a viac nepotrebujem | |
re: Web scraping, web crawlers (Colombo) RP (25.5.2015 7:16) ⇥ |
↻ |
Nejde o to, že nutně chci s něčím pomoct (ačkoliv to by se taky hodilo), jde o to, že mi ta problematika vlastně přijde zajímavá a když už sem na to narazil, rád bych se přiučil. | |
re: Web scraping, web crawlers (vecernik) RP (25.5.2015 7:08) ⇥ |
↻ |
Jo. Delal jsem v minulosti hodne ale spis na tvorbu statistik (miss leta z Blesku, vyvoj ceny jidel v menzach, kompletni seznam hracu a jejich vlastnosti na wow serveru, parsovani RUIAN XML) Kazdopadne vsecky tyhle veci jsou hodne specificke. Stejne jako tvoje pozadavky. |
|
Web scraping, web crawlers (Colombo) RP (25.5.2015 5:53) ⇥ |
↻ |
Dělal někdo? Trochu si o tom čtu a připadá mi, že to je naprosto skvělý způsob jak získat hromadu sociálních dat. Máte s tím někdo zkušenosti? Celkem mě to zajímá. Osobně sem teď řešil problém jak se dostat k antropologickým datům, která jsou rozeseta různě po internetu, v článcích, knihách atp., a ne v jednotné databázi, kterou z toho vytvářím. Původně sem chtěl použít google api, jenže jak sem se dozvěděl, v custom api google search používá naprosto jiné indexování, takže to, co sem hledal, mělo v custom search api naprosto rozdílné výsledky než skrze prohlížeč. Tedy jsem nucen používat Bing (limit je dokonce větší). Jenže chybí mi něco, co by nahradilo google scholar, abych si mohl prohlídnout i něco z akademických prací. |
|