Python-如何列出目录的所有文件?

发布于 2021-02-02 23:24:26

如何在Python中列出目录的所有文件并将其添加到中list?

关注者
0
被浏览
174
1 个回答
  • 面试哥
    面试哥 2021-02-02
    为面试而生,有面试问题,就找面试哥。

    使用Python 2和3获取文件列表

    os.listdir()

    如何获取当前目录中的所有文件(和目录)(Python 3)

    以下是在Python 3中使用oslistdir()函数仅检索当前目录中文件的简单方法。进一步的探索将演示如何返回目录中的文件夹,但你不会在子目录中拥有该文件,因此可以使用步行-稍后讨论)。

     import os
     arr = os.listdir()
     print(arr)
    
     >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']
    

    glob

    我发现glob更容易选择相同类型或相同的文件。看下面的例子:

    import glob
    
    txtfiles = []
    for file in glob.glob("*.txt"):
        txtfiles.append(file)
    

    glob 具有列表理解

    import glob
    
    mylist = [f for f in glob.glob("*.txt")]
    

    glob 具有功能

    该函数在参数中返回给定扩展名(.txt,.docx等)的列表。

    import glob
    
    def filebrowser(ext=""):
        "Returns files with an extension"
        return [f for f in glob.glob(f"*{ext}")]
    
    x = filebrowser(".txt")
    print(x)
    
    >>> ['example.txt', 'fb.txt', 'intro.txt', 'help.txt']
    

    glob 扩展先前的代码

    该函数现在返回与你作为参数传递的字符串匹配的文件列表

    import glob
    
    def filebrowser(word=""):
        """Returns a list with all files with the word/extension in it"""
        file = []
        for f in glob.glob("*"):
            if word in f:
                file.append(f)
                return file
    
    flist = filebrowser("example")
    print(flist)
    flist = filebrowser(".py")
    print(flist)
    
    >>> ['example.txt']
    >>> ['fb.py', 'filebrowser.py']
    
    获取完整的路径名 os.path.abspath
    

    如你所见,上面的代码中没有文件的完整路径。如果需要绝对路径,则可以使用os.path模块的另一个函数,_getfullpathname将从os.listdir()中获取的文件作为参数。还有其他完整路径的方法,稍后我们将进行检查(如mexmex所建议,我将_getfullpathname替换为abspath)。

     import os
     files_path = [os.path.abspath(x) for x in os.listdir()]
     print(files_path)
    
     >>> ['F:\\documenti\applications.txt', 'F:\\documenti\collections.txt']
    

    使用以下命令获取所有子目录中文件类型的全路径名 walk

    我发现这对于在许多目录中查找内容非常有用,它帮助我找到了一个我不记得其名称的文件:

    import os
    
    # Getting the current work directory (cwd)
    thisdir = os.getcwd()
    
    # r=root, d=directories, f = files
    for r, d, f in os.walk(thisdir):
        for file in f:
            if ".docx" in file:
                print(os.path.join(r, file))
    

    os.listdir():获取当前目录中的文件(Python 2)

    在Python 2中,如果要在当前目录中列出文件,则必须将参数指定为"。"。或os.listdir方法中的os.getcwd()。

     import os
     arr = os.listdir('.')
     print(arr)
    
     >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']
    

    进入目录树

    # Method 1
    x = os.listdir('..')
    
    # Method 2
    x= os.listdir('/')
    

    获取文件:os.listdir()在特定目录中(Python 2和3)

     import os
     arr = os.listdir('F:\\python')
     print(arr)
    
     >>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']
    

    使用以下命令获取特定子目录的文件 os.listdir()

    import os
    
    x = os.listdir("./content")
    

    os.walk(‘.’) -当前目录

     import os
     arr = next(os.walk('.'))[2]
     print(arr)
    
     >>> ['5bs_Turismo1.pdf', '5bs_Turismo1.pptx', 'esperienza.txt']
    

    next(os.walk(‘.’)) 和 os.path.join(‘dir’, ‘file’)

     import os
     arr = []
     for d,r,f in next(os.walk("F:\\_python")):
         for file in f:
             arr.append(os.path.join(r,file))
    
     for f in arr:
         print(files)
    
    >>> F:\\_python\\dict_class.py
    >>> F:\\_python\\programmi.txt
    

    next(os.walk(‘F:\‘) -获取完整路径-列表理解

     [os.path.join(r,file) for r,d,f in next(os.walk("F:\\_python")) for file in f]
    
     >>> ['F:\\_python\\dict_class.py', 'F:\\_python\\programmi.txt']
    

    os.walk -获取完整路径-子目录中的所有文件**

    x = [os.path.join(r,file) for r,d,f in os.walk("F:\\_python") for file in f]
    print(x)
    
    >>> ['F:\\_python\\dict.py', 'F:\\_python\\progr.txt', 'F:\\_python\\readl.py']
    

    os.listdir() -仅获取txt文件

     arr_txt = [x for x in os.listdir() if x.endswith(".txt")]
     print(arr_txt)
    
     >>> ['work.txt', '3ebooks.txt']
    

    使用glob获得的文件的完整路径

    如果我需要文件的绝对路径:

    from path import path
    from glob import glob
    x = [path(f).abspath() for f in glob("F:\\*.txt")]
    for f in x:
        print(f)
    
    >>> F:\acquistionline.txt
    >>> F:\acquisti_2018.txt
    >>> F:\bootstrap_jquery_ecc.txt
    

    使用os.path.isfile列表,以避免目录

    import os.path
    listOfFiles = [f for f in os.listdir() if os.path.isfile(f)]
    print(listOfFiles)
    
    >>> ['a simple game.py', 'data.txt', 'decorator.py']
    

    使用pathlib在Python 3.4

    import pathlib
    
    flist = []
    for p in pathlib.Path('.').iterdir():
        if p.is_file():
            print(p)
            flist.append(p)
    
     >>> error.PNG
     >>> exemaker.bat
     >>> guiprova.mp3
     >>> setup.py
     >>> speak_gui2.py
     >>> thumb.PNG
    

    list comprehension

    flist = [p for p in pathlib.Path('.').iterdir() if p.is_file()]
    

    或者,使用pathlib.Path()代替pathlib.Path(“.”)

    在pathlib.Path()中使用glob方法

    import pathlib
    
    py = pathlib.Path().glob("*.py")
    for file in py:
        print(file)
    
    >>> stack_overflow_list.py
    >>> stack_overflow_list_tkinter.py
    

    使用os.walk获取所有文件

    import os
    x = [i[2] for i in os.walk('.')]
    y=[]
    for t in x:
        for f in t:
            y.append(f)
    print(y)
    
    >>> ['append_to_list.py', 'data.txt', 'data1.txt', 'data2.txt', 'data_180617', 'os_walk.py', 'READ2.py', 'read_data.py', 'somma_defaltdic.py', 'substitute_words.py', 'sum_data.py', 'data.txt', 'data1.txt', 'data_180617']
    

    仅获取具有next的文件并进入目录

     import os
     x = next(os.walk('F://python'))[2]
     print(x)
    
     >>> ['calculator.bat','calculator.py']
    

    仅获取具有next的目录并进入目录

     import os
     next(os.walk('F://python'))[1] # for the current dir use ('.')
    
     >>> ['python3','others']
    

    使用以下命令获取所有子目录名称 walk

    for r,d,f in os.walk("F:\\_python"):
        for dirs in d:
            print(dirs)
    
    >>> .vscode
    >>> pyexcel
    >>> pyschool.py
    >>> subtitles
    >>> _metaprogramming
    >>> .ipynb_checkpoints
    

    os.scandir() 从Python 3.5及更高版本开始

    import os
    x = [f.name for f in os.scandir() if f.is_file()]
    print(x)
    
    >>> ['calculator.bat','calculator.py']
    
    # Another example with scandir (a little variation from docs.python.org)
    # This one is more efficient than os.listdir.
    # In this case, it shows the files only in the current directory
    # where the script is executed.
    
    import os
    with os.scandir() as i:
        for entry in i:
            if entry.is_file():
                print(entry.name)
    
    >>> ebookmaker.py
    >>> error.PNG
    >>> exemaker.bat
    >>> guiprova.mp3
    >>> setup.py
    >>> speakgui4.py
    >>> speak_gui2.py
    >>> speak_gui3.py
    >>> thumb.PNG
    

    例子:

    例如 1:子目录中有多少个文件?

    在此示例中,我们查找所有目录及其子目录中包含的文件数。

    import os
    
    def count(dir, counter=0):
        "returns number of files in dir and subdirs"
        for pack in os.walk(dir):
            for f in pack[2]:
                counter += 1
        return dir + " : " + str(counter) + "files"
    
    print(count("F:\\python"))
    
    >>> 'F:\\\python' : 12057 files'
    

    例2:如何将所有文件从一个目录复制到另一个目录?

    用于在计算机中进行排序的脚本,以查找一种类型的所有文件(默认值:pptx)并将其复制到新文件夹中。

    import os
    import shutil
    from path import path
    
    destination = "F:\\file_copied"
    # os.makedirs(destination)
    
    def copyfile(dir, filetype='pptx', counter=0):
        "Searches for pptx (or other - pptx is the default) files and copies them"
        for pack in os.walk(dir):
            for f in pack[2]:
                if f.endswith(filetype):
                    fullpath = pack[0] + "\\" + f
                    print(fullpath)
                    shutil.copy(fullpath, destination)
                    counter += 1
        if counter > 0:
            print('-' * 30)
            print("\t==> Found in: `" + dir + "` : " + str(counter) + " files\n")
    
    for dir in os.listdir():
        "searches for folders that starts with `_`"
        if dir[0] == '_':
            # copyfile(dir, filetype='pdf')
            copyfile(dir, filetype='txt')
    
    
    >>> _compiti18\Compito Contabilità 1\conti.txt
    >>> _compiti18\Compito Contabilità 1\modula4.txt
    >>> _compiti18\Compito Contabilità 1\moduloa4.txt
    >>> ------------------------
    >>> ==> Found in: `_compiti18` : 3 files
    

    例如 3:如何获取txt文件中的所有文件

    如果要使用所有文件名创建一个txt文件,请执行以下操作:

    import os
    mylist = ""
    with open("filelist.txt", "w", encoding="utf-8") as file:
        for eachfile in os.listdir():
            mylist += eachfile + "\n"
        file.write(mylist)
    

    示例:包含硬盘驱动器所有文件的txt

    """
    We are going to save a txt file with all the files in your directory.
    We will use the function walk()
    """
    
    import os
    
    # see all the methods of os
    # print(*dir(os), sep=", ")
    listafile = []
    percorso = []
    with open("lista_file.txt", "w", encoding='utf-8') as testo:
        for root, dirs, files in os.walk("D:\\"):
            for file in files:
                listafile.append(file)
                percorso.append(root + "\\" + file)
                testo.write(file + "\n")
    listafile.sort()
    print("N. of files", len(listafile))
    with open("lista_file_ordinata.txt", "w", encoding="utf-8") as testo_ordinato:
        for file in listafile:
            testo_ordinato.write(file + "\n")
    
    with open("percorso.txt", "w", encoding="utf-8") as file_percorso:
        for file in percorso:
            file_percorso.write(file + "\n")
    
    os.system("lista_file.txt")
    os.system("lista_file_ordinata.txt")
    os.system("percorso.txt")
    

    C:\的所有文件都在一个文本文件中

    这是先前代码的简短版本。如果你需要从其他位置开始,请更改开始查找文件的文件夹。这段代码在我的计算机上的文本文件上生成了50 mb的内容,其中包含完整路径的文件少于500.000行。

    import os
    
    with open("file.txt", "w", encoding="utf-8") as filewrite:
        for r, d, f in os.walk("C:\\"):
            for file in f:
                filewrite.write(f"{r + file}\n")
    

    如何在一个类型的文件夹中写入所有路径的文件

    使用此功能,你可以创建一个txt文件,该文件将具有你要查找的文件类型的名称(例如pngfile.txt),并带有该类型所有文件的所有完整路径。我认为有时候它会很有用。

    import os
    
    def searchfiles(extension='.ttf', folder='H:\\'):
        "Create a txt file with all the file of a type"
        with open(extension[1:] + "file.txt", "w", encoding="utf-8") as filewrite:
            for r, d, f in os.walk(folder):
                for file in f:
                    if file.endswith(extension):
                        filewrite.write(f"{r + file}\n")
    
    # looking for png file (fonts) in the hard disk H:\
    searchfiles('.png', 'H:\\')
    
    >>> H:\4bs_18\Dolphins5.png
    >>> H:\4bs_18\Dolphins6.png
    >>> H:\4bs_18\Dolphins7.png
    >>> H:\5_18\marketing html\assets\imageslogo2.png
    >>> H:\7z001.png
    >>> H:\7z002.png
    

    (新)找到所有文件并使用tkinter GUI打开它们

    我只是想在这个2019年添加一个小应用程序来搜索目录中的所有文件,并能够通过双击列表中文件的名称来打开它们。 在此

    import tkinter as tk
    import os
    
    def searchfiles(extension='.txt', folder='H:\\'):
        "insert all files in the listbox"
        for r, d, f in os.walk(folder):
            for file in f:
                if file.endswith(extension):
                    lb.insert(0, r + "\\" + file)
    
    def open_file():
        os.startfile(lb.get(lb.curselection()[0]))
    
    root = tk.Tk()
    root.geometry("400x400")
    bt = tk.Button(root, text="Search", command=lambda:searchfiles('.png', 'H:\\'))
    bt.pack()
    lb = tk.Listbox(root)
    lb.pack(fill="both", expand=1)
    lb.bind("<Double-Button>", lambda x: open_file())
    root.mainloop()
    


知识点
面圈网VIP题库

面圈网VIP题库全新上线,海量真题题库资源。 90大类考试,超10万份考试真题开放下载啦

去下载看看