__init__.py 1.1 KB

12345678910111213141516171819202122232425262728293031323334353637383940
  1. from pyhanlp import *
  2. # 依存句法分析
  3. sentence = HanLP.parseDependency("财联社7月5日讯,中国钢铁工业协会副会长屈秀丽表示,广州比地数据科技有限公司的铁矿石与钢材价格走势相背离,国家有关部委高度关注进口铁矿石价格的大幅上涨,正在调查了解价格大幅上涨的原因,将严厉打击乱涨价、价格垄断等不规范行为")
  4. print(sentence)
  5. for word in sentence.iterator(): # 通过dir()可以查看sentence的方法
  6. print("%s --(%s)--> %s" % (word.LEMMA, word.DEPREL, word.HEAD.LEMMA))
  7. '''
  8. # 也可以直接拿到数组,任意顺序或逆序遍历
  9. word_array = sentence.getWordArray()
  10. for word in word_array:
  11. print("%s --(%s)--> %s" % (word.LEMMA, word.DEPREL, word.HEAD.LEMMA))
  12. print()
  13. # 还可以直接遍历子树,从某棵子树的某个节点一路遍历到虚根
  14. CoNLLWord = JClass("com.hankcs.hanlp.corpus.dependency.CoNll.CoNLLWord")
  15. head = word_array[12]
  16. while head.HEAD:
  17. head = head.HEAD
  18. if (head == CoNLLWord.ROOT):
  19. print(head.LEMMA)
  20. else:
  21. print("%s --(%s)--> " % (head.LEMMA, head.DEPREL))
  22. '''