Ответ 1
Эта страница Ruby Toolbox содержит диаграмму относительной популярности различных парсеров.
Мне нравится библиотека соскабливания Beautiful Soup на Python. Это просто работает. Есть ли близкий эквивалент в Ruby?
Эта страница Ruby Toolbox содержит диаграмму относительной популярности различных парсеров.
Nokogiri - еще один парсер HTML/XML. Это быстрее, чем hpricot в соответствии с этими критериями. Nokogiri использует libxml2 и является заменой hpricot. Он также имеет поддержку селектора css3, которая довольно приятна.
Изменить: Там новый тест, сравнивающий nokogiri, libxml-ruby, hpricot и rexml здесь.
Ruby Toolbox имеет категорию для парсеров HTML здесь.
Там scRUBYt!, Rubyful-soup (больше не поддерживается), WWW:: Механизировать, scrAPI и еще несколько.
Или вы можете просто использовать Hpricot или Nokogiri для разбора.
Hpricot? Я не знаю, что другие используют...