如何读取YAML文件中的组件,以便可以使用ruamel.yaml编辑其键值?

发布于 2021-01-29 16:55:27

这是我的YAML文件(input.yaml):

team_member:
  name: Max
  hobbies:
    - Reading

team_leader:
  name: Stuart
  hobbies:
    - dancing

我想编辑此YAML文件以在关键“爱好”中添加更多值,例如:

team_member:
  name: Max
  hobbies:
    - Reading
    - Painting

team_leader:
  name: Stuart
  hobbies:
    - Dancing
    - Fishing

我尝试实现代码Anthon以适合我的情况,但是它根本没有帮助,因为该YAML文件的缩进级别与我的不同。
例:

import sys
import ruamel.yaml

yaml = ruamel.yaml.YAML()
# yaml.preserve_quotes = True
with open('input.yaml') as fp:
    data = yaml.load(fp)
for elem in data:
    if elem['name'] == 'Stuart':
         elem['hobbies'] = ['Fishing']
         break  # no need to iterate further
yaml.dump(data, sys.stdout)

我收到错误“ TypeError(’字符串索引必须为整数’,)”,我知道此代码可能完全错误,但是我对ruamel.yaml不熟悉。

该如何编码?

关注者
0
被浏览
160
1 个回答
  • 面试哥
    面试哥 2021-01-29
    为面试而生,有面试问题,就找面试哥。

    错误信息显示的是行号(我假设它是9)。指向那条线

        if elem['name'] == 'Stuart':
    

    而且,如果这没有给您任何提示,那么我在这种情况下建议的方法就是开始添加一些print功能,以便您知道自己在做什么。该for循环是这样的:

    for elem in data:
        print('elem', elem)
        if elem['name'] == 'Stuart':
             print('elem->hobbies', elem['hobbies'])
             elem['hobbies'] = ['Fishing']
    

    此打印

     elem team_member
    

    在引发异常之前,我希望这使您意识到自己不是在遍历列表的 元素 (项目),而是遍历dict的 (由YAML的根级别映射构成)。与键相关联的
    是具有键name和键的对象hobbies

    因此,请更改变量elemkey明确您要处理的内容,然后继续使用value与该键关联的值,而不是elem在该循环中¹:

    for key in data:
        value = data[key]
        if value['name'] == 'Stuart':
             print('value->hobbies', value['hobbies'])
             value['hobbies'] = ['Fishing']
    

    这给出:

    value->hobbies ['dancing']
    team_member:
      name: Max
      hobbies:
      - Reading
    
    team_leader:
      name: Stuart
      hobbies:
      - Fishing
    

    因此,我们摆脱了异常,但是结果却不完全是您想要的。dancing密钥“爱好”的元素消失了,因为您为该密钥分配了一个新的(列表)值,而您应该做的是将一个项目附加到列表中。现在我们也可以摆脱打印功能:

    for key in data:
        value = data[key]
        if value['name'] == 'Stuart':
             value['hobbies'].append('Fishing')
    

    这将使您在文件的最后顺序中得到两项。还有其他一些事情要解决:

    • 大写dancing不正确。若要更正此问题,如果只有一个元素,则添加一行处理列表
    • 名称的代码Max需要添加(这就是为什么需要删除break代码中的的原因)
    • 空行被视为对第一个序列的最后一个元素的注释,该注释需要移动
    • 您的序列缩进不是默认值

    最终代码如下:

    from pathlib import Path
    import ruamel.yaml
    
    path = Path('input.yaml')
    yaml = ruamel.yaml.YAML()
    yaml.indent(sequence=4, offset=2)  # for the non-default indentation of sequences
    
    data = yaml.load(path)
    for key in data:
        value = data[key]
        if value['name'] == 'Stuart':
             if len(value['hobbies']) == 1:
                 value['hobbies'][0] = value['hobbies'][0].capitalize()
             value['hobbies'].append('Fishing')
        elif value['name'] == 'Max':
             last_item_index = len(value['hobbies']) - 1
             value['hobbies'].append('Painting')
             comments = value['hobbies'].ca
             if not comments.items[last_item_index][0].value.strip():
                 # move empty comment lines from previous last item to new last item
                 comments.items[last_item_index + 1] = comments.items.pop(last_item_index)
    
    yaml.dump(data, path)
    

    这使您获得的东西非常接近您想要的

    team_member:
      name: Max
      hobbies:
        - Reading
        - Painting
    
    team_leader:
      name: Stuart
      hobbies:
        - Dancing
        - Fishing
    

    ¹前两行的替代方法:for key, value in data.items()



知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看