Tweepy截断状态
我正在使用tweepy挖掘用户时间轴数据,并且在理解以下内容时遇到了一些困难:
- “转发”和“截断”属性是否指的是同一件事(即状态文本超过140个字符)?
- 如果没有,有什么区别?
- 我遇到一个stackoverflow问题,有人问如何检索由于长度超过140个字符而被“剪切”的状态文本。它建议_json字典中有一个转发的属性,如果是这种情况,则为true,并且完整的状态文本将位于status-> retweeted_status-> text下。但是,我找不到它,唯一的状态文本在status->以’…’结尾的文本下。我是否弄错了,如果是这样,如何获得全文?
感谢您的帮助。
-
“转发”和“截断”属性是否指的是同一件事(即状态文本超过140个字符)? 如果没有,有什么区别?
不,推文不仅可以在转发(转发)之后被截断,还可以在回复或提及之后被截断(请参阅下面的示例,这不是转发)。在这种情况下,“截断”将设置为“真”(“转发”将为“真”或“假”)。如果tweet的大小远低于140个字符,则不会被截断,也有可能使“
reweeted”等于True,而“ truncated”等于False。它建议_json字典中有一个转发的属性,如果是这种情况,则为true,并且完整的状态文本将在status- > retweeted_status->
text下。仅当该推文是真正的推文时,这才是正确的。实际上,如果retweeted_status来自另一个被截断的推文,它本身也可以被截断。最好的方法是使用
tweet_mode='extended'
Tweepy中的参数来检索全文(不幸的是,Tweepy文档中没有记录)。例如:(不扩展)
print api.get_status('862328512405004288')._json['text']
@tousuncotefoot @equipedefrance @CreditAgricole @AntoGriezmann @KMbappe
@layvinkurzawa @UmtitiSam J’ai jamais vue d… https:// tco /
kALZ2ki9Vc(扩展)
print api.get_status('862328512405004288', tweet_mode='extended')._json['full_text']
@tousuncotefoot @equipedefrance @CreditAgricole @AntoGriezmann @KMbappe
@layvinkurzawa @UmtitiSam J’ai jamais vue de match de foot et cela ferait un
beau cadeau pour mon copain !! 🙏🏻🙏🏻🙏🏻😍😍