Собственно, появилось желание немного попарсить ее. Вчера немного попробовал, но при попытки взять страницу через file_get_contens(), получаю 403. Как поступить? Юзать курл и подделывать юзер-агент или еще что-то нужно? Кто занимался, не поделитесь опытом? Вот попробовал на курле скрипт написать, не работает (( PHP: <? $url = "http://ru.wikipedia.org/wiki/"; echo '<form action="" method="POST"> <input type="text" name="word" value="'.$_POST['word'].'"><br> <input type="submit"> </form>'; $user_agent = 'Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.8.0.9) Gecko/20061206 Firefox/1.5.0.9'; $header = array( "Accept: text/xml,application/xml,application/xhtml+xml, text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5", "Keep-Alive: 300"); if($_POST['word'] != ""){ $url = $url.urlencode($_POST['word']); echo $url; $res = curl_init($url); curl_setopt($res, CURLOPT_USERAGENT, $user_agent); curl_setopt($res, CURLOPT_VERBOSE, 1); curl_setopt($res, CURLOPT_HTTPHEADER, $header); echo $res.'<br>'; $out = array(); $str = curl_exec($res); echo $str; curl_close($res); preg_match_all('/<li class="interwiki-ja"><a href="http:\/\/ja.wikipedia.org\/wiki\/.+">(.+)<\/a><\/li>/', $str, $out); echo $out[1][0]; } ?>
Чисто для себя. Некоторые понятия переводить на японский, т.к. во многих словарях, которые я нашел, нет многих слов. Больше технические термины.