Как извлечь один файл с историей фиксации из репозитория git с индексом-фильтром & co
Моя ситуация была, у меня есть репозиторий git, преобразованный из SVN в HG в GIT, и я хотел извлечь только один исходный файл. У меня также были такие странные символы, как aÌ (несоответствие кодировки искажено Unicode ä) и пробелы в именах файлов.
Кажется, что это не очень просто, и что я отвечу на свой вопрос, несмотря на многие подобные вопросы относительно git [index-filter | subdirectory-filter | filter-tree], поскольку мне нужно было использовать все раньше этого достичь!
Итак, вопрос: "Как я могу извлечь один файл из репозитория и поместить его в корень нового репо?"
Ответы
Ответ 1
Прежде всего, обратите внимание, что даже заклинание, как в комментарии разделяет набор файлов в репозитории git в свой собственный репозиторий, сохраняя соответствующую историю
SPELL='git ls-tree -r --name-only --full-tree "$GIT_COMMIT" | grep -v "trie.lisp" | tr "\n" "\0" | xargs -0 git rm --cached -r --ignore-unmatch'
git filter-branch --prune-empty --index-filter "$SPELL" -- --all
не будет работать с файлами с именем imaging/DrinkkejaI<0300>$'\302\210'.txt_74x2032.gif
.
Одна часть aI<0300>$'\302\210'
была единственной буквой: ä
.
Итак, чтобы извлечь один файл, в дополнение к ветки фильтра, мне также нужно было сделать:
git filter-branch -f --subdirectory-filter lisp/source/model HEAD
В качестве альтернативы вы можете использовать -tree-filter:
(тест необходим, поскольку файл находился в другом каталоге ранее, см.
Как переместить каталог в репозиторий git для всех коммитов?)
MV_FILTER='test -f source/model/trie.lisp && mv ./source/model/trie.lisp . || echo "Nothing to do."'
git filter-branch --tree-filter $MV_FILTER HEAD --all
Чтобы просмотреть все имена, которые были у файла, используйте:
git log --pretty=oneline --follow --name-only git-path/to/file | grep -v ' ' | sort -u
Как описано в http://whileimautomaton.net/2010/04/03012432
Также выполните следующие действия:
$ git reset --hard
$ git gc --aggressive
$ git prune
$ git remote rm origin # Otherwise changes will be pushed to where the repo was cloned from
Ответ 2
Более быстрый и понятный фильтр, который выполняет то же самое:
git filter-branch --index-filter '
git read-tree --empty
git reset $GIT_COMMIT -- $your $files $here
' \
-- --all -- $your $files $here
Ответ 3
Обратите внимание, что все становится намного проще, если вы объедините это с дополнительным шагом перемещения нужного файла (ов) в новый каталог.
Это может быть довольно распространенный случай использования (например, перемещение нужного отдельного файла в корневой каталог).
Я сделал это (используя git 1.9), как это (сначала перемещая файл (ы), а затем удаляя старое дерево):
git filter-branch -f --tree-filter 'mkdir -p new_path && git mv -k -f old_path/to/file new_path/'
git filter-branch -f --prune-empty --index-filter 'git rm -r --cached --ignore-unmatch old_path'
Вы даже можете легко использовать подстановочные знаки для желаемых файлов (без использования grep -v).
Я думаю, что это ('mv' и 'rm') также можно было бы сделать в одной ветки фильтра, но это не помогло мне.
Я не пробовал это с странными персонажами, но надеюсь, что это все равно поможет. Делать вещи проще, кажется, всегда будет хорошей идеей для меня.
Подсказка:
Это много времени для крупных РЕПО. Поэтому, если вы хотите сделать несколько действий (например, получить кучу файлов, а затем переставить их в "new_path/subdirs" ), рекомендуется как можно скорее сделать "rm" часть, чтобы получить меньшее и быстрое дерево.
Ответ 4
Следующее переписает историю и сохранит только те коммиты, которые касаются списка файлов, которые вы даете. Возможно, вы захотите сделать это в клоне вашего хранилища, чтобы не потерять оригинальную историю.
FILES='path/to/file1 other-path/to/file2 file3'
git filter-branch --prune-empty --index-filter "
git read-tree --empty
git reset \$GIT_COMMIT -- $FILES
" \
-- --all -- $FILES
Затем вы можете объединить эту новую ветку с вашим целевым репозиторием с помощью обычных команд merge
или rebase
соответствии с вашим вариантом использования.