非常喜欢Nokogiri的简洁,尤其是根据css和xpath查找元素。有时又觉得Nokogiri太简洁了,连抓取失败重试的机制都没有。可惜在景德镇,网络经常丢包,真是郁闷。 所以写这段代码,以后肯定常用。
1 2 3 4 5 6 | |
Tips: retry可以跳回begin 这段代码将打印log并一直重试直到成功。估计这样写不大合适,因为一旦发生一个小错误,将会导致死循环。比较好的做法是,循环10次,如果都失败就放弃。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | |
非常喜欢Nokogiri的简洁,尤其是根据css和xpath查找元素。有时又觉得Nokogiri太简洁了,连抓取失败重试的机制都没有。可惜在景德镇,网络经常丢包,真是郁闷。 所以写这段代码,以后肯定常用。
1 2 3 4 5 6 | |
Tips: retry可以跳回begin 这段代码将打印log并一直重试直到成功。估计这样写不大合适,因为一旦发生一个小错误,将会导致死循环。比较好的做法是,循环10次,如果都失败就放弃。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 | |