def extracttext(self, response, number, ref):
textfragment = self.fragmenttxt(response,number)
res = ""
#Es el texto entero y no hay que fragmentar
if not Utils.checkownRef(textfragment,ref):
return Utils.removeHTMLtags(textfragment)
texto = self.extractbyref(textfragment,ref,number)
pages = Selector(response).xpath('//a/@name').extract()
#para empezar desde el indice
#bbusca mas texto
hasfirsttext = False
if Utils.isDiferentFirstTime(textfragment,ref):
hasfirsttext=True
if not hasfirsttext:
pages = Utils.convertPagToNum(pages)
try:
index = pages.index(number)
except:
index=0
for page in pages[index:]:
if int(page) > int(number):
textfragment = self.fragmenttxt(response, page)
texto += self.extractother(textfragment, ref)
#si encuentra el otro rompe bucle
if Utils.checkotherRefandnotOwn(textfragment,ref):
break
res = Utils.removeHTMLtags(texto)
return res
评论列表
文章目录