脚本专栏 
首页 > 脚本专栏 > 浏览文章

ruby实现网页图片抓取

(编辑:jimmy 日期: 2024/5/9 浏览:3 次 )

前段时间看到很多人写的下妹子脚本,自己也写一个

module CommonHelper
 
 require 'nokogiri'
 require 'open-uri'
 
 def down_load_xmz
  site_url = "http://www.xxx.com"
 
  for index_page in 1..141
   doc_html = Nokogiri::HTML(open(site_url+'/share/comment-page-'+index_page.to_s))
   doc_html.css("#comments p img").each do |item_img|
    puts item_img[:src]
    download_img(item_img[:src])
   end
  end
 end
 
 ########下载图片
 def download_img(img_url)
  begin
   img_file = open(img_url) { |f| f.read }
   file_name = img_url.split('/').last
   #puts file_name
   open("public/meizi/"+file_name, "wb") { |f| f.write(img_file) }
   return "/public/meizi/"+file_name
  rescue => err
   puts err
   return ''
  end
 end
 
end

以上所述就是本文的全部内容了,希望大家能够喜欢。

上一篇:Ruby中关于模块的一些基础知识
下一篇:Ruby初学笔记之Hello World
一句话新闻
高通与谷歌联手!首款骁龙PC优化Chrome浏览器发布
高通和谷歌日前宣布,推出首次面向搭载骁龙的Windows PC的优化版Chrome浏览器。
在对骁龙X Elite参考设计的初步测试中,全新的Chrome浏览器在Speedometer 2.1基准测试中实现了显著的性能提升。
预计在2024年年中之前,搭载骁龙X Elite计算平台的PC将面世。该浏览器的提前问世,有助于骁龙PC问世就获得满血表现。
谷歌高级副总裁Hiroshi Lockheimer表示,此次与高通的合作将有助于确保Chrome用户在当前ARM兼容的PC上获得最佳的浏览体验。
友情链接:杰晶网络 DDR爱好者之家 南强小屋 黑松山资源网 白云城资源网