Как вы проходите через каталоги с помощью python?
У меня есть папка с именем notes, естественно, они будут разбиты на категории по папкам, и в этих папках также будут подпапки для подкатегорий. Теперь моя проблема в том, что у меня есть функция, проходящая через 3 уровня подкаталогов:
def obtainFiles(path):
list_of_files = {}
for element in os.listdir(path):
# if the element is an html file then..
if element[-5:] == ".html":
list_of_files[element] = path + "/" + element
else: # element is a folder therefore a category
category = os.path.join(path, element)
# go through the category dir
for element_2 in os.listdir(category):
dir_level_2 = os.path.join(path,element + "/" + element_2)
if element_2[-5:] == ".html":
print "- found file: " + element_2
# add the file to the list of files
list_of_files[element_2] = dir_level_2
elif os.path.isdir(element_2):
subcategory = dir_level_2
# go through the subcategory dir
for element_3 in os.listdir(subcategory):
subcategory_path = subcategory + "/" + element_3
if subcategory_path[-5:] == ".html":
print "- found file: " + element_3
list_of_files[element_3] = subcategory_path
else:
for element_4 in os.listdir(subcategory_path):
print "- found file:" + element_4
Обратите внимание, что это все еще очень большая работа. Это очень уродливо в моих глазах...
То, что я пытаюсь достичь здесь, - это пройти все папки и подпапки вниз и поместить все имена файлов в словарь под названием "list_of_files", имя "ключ" и полный путь как "значение". Функция пока не совсем работает, но было интересно, как использовать функцию os.walk для выполнения подобной вещи?
Спасибо
Ответы
Ответ 1
Основываясь на ваших кратких описаниях, что-то вроде этого должно работать:
list_of_files = {}
for (dirpath, dirnames, filenames) in os.walk(path):
for filename in filenames:
if filename.endswith('.html'):
list_of_files[filename] = os.sep.join([dirpath, filename])
Ответ 2
Вы можете сделать это:
list_of_files = dict([ (file, os.sep.join((dir, file)))
for (dir,dirs,files) in os.walk(path)
for file in files
if file[-5:] == '.html' ])
Ответ 3
альтернативой является использование генератора, построенного по коду @ig0774
import os
def walk_through_files(path, file_extension='.html'):
for (dirpath, dirnames, filenames) in os.walk(path):
for filename in filenames:
if filename.endswith(file_extension):
yield os.path.join(dirpath, filename)
а затем
for fname in walk_through_files():
print(fname)
Ответ 4
Я сталкивался с этим вопросом несколько раз, и ни один из ответов не удовлетворяет меня - поэтому создал a script для этого. Pytohn очень громоздко использовать, когда дело доходит до прохода по каталогам.
Вот как это можно использовать:
import file_walker
for f in file_walker.walk("/a/path"):
print(f.name, f.full_path) # Name is without extension
if f.isDirectory: # Check if object is directory
for sub_f in f.walk(): # Easily walk on new levels
if sub_f.isFile: # Check if object is file (= !isDirectory)
print(sub_f.extension) # Print file extension
with sub_f.open("r") as open_f: # Easily open file
print(open_f.read())