Как рассчитан хэш git?

Я пытаюсь понять, как git вычисляет хэш ref.

$ git ls-remote https://github.com/git/git  

....
29932f3915935d773dc8d52c292cadd81c81071d    refs/tags/v2.4.2
9eabf5b536662000f79978c4d1b6e4eff5c8d785    refs/tags/v2.4.2^{}
....

Клонировать репо локально. Проверьте refs/tags/v2.4.2^{} ref by sha

$ git cat-file -p 9eabf5b536662000f79978c4d1b6e4eff5c8d785 

tree 655a20f99af32926cbf6d8fab092506ddd70e49c
parent df08eb357dd7f432c3dcbe0ef4b3212a38b4aeff
author Junio C Hamano <[email protected]> 1432673399 -0700
committer Junio C Hamano <[email protected]> 1432673399 -0700

Git 2.4.2

Signed-off-by: Junio C Hamano <[email protected]>

Скопируйте распакованный контент, чтобы мы могли его хешировать. (AFAIK git использует несжатую версию при его хешировании)

git cat-file -p 9eabf5b536662000f79978c4d1b6e4eff5c8d785 > fi

Пусть SHA-1 содержимое с использованием git собственной хэш-команды

git hash-object fi
3cf741bbdbcdeed65e5371912742e854a035e665

Почему вывод не [9e]abf5b536662000f79978c4d1b6e4eff5c8d785? Я понимаю, что первые два символа (9e) - это длина в шестнадцатеричном формате. Как я должен хэш содержание fi, чтобы я мог получить git ref abf5b536662000f79978c4d1b6e4eff5c8d785?

Ответы

Ответ 1

Как описано в " Как git commit sha1 сформирован", формула:

(printf "<type> %s\0" $(git cat-file <type> <ref> | wc -c); git cat-file <type> <ref>)|sha1sum

В случае commit 9eabf5b536662000f79978c4d1b6e4eff5c8d785 (который v2.4.2^{} и который ссылается на дерево):

(printf "commit %s\0" $(git cat-file commit 9eabf5b536662000f79978c4d1b6e4eff5c8d785 | wc -c); git cat-file commit 9eabf5b536662000f79978c4d1b6e4eff5c8d785 )|sha1sum

Это даст 9eabf5b536662000f79978c4d1b6e4eff5c8d785.

Как бы:

(printf "commit %s\0" $(git cat-file commit v2.4.2{} | wc -c); git cat-file commit v2.4.2{})|sha1sum

(все еще 9eabf5b536662000f79978c4d1b6e4eff5c8d785)

Аналогично, вычисление SHA1 тега v2.4.2 будет:

(printf "tag %s\0" $(git cat-file tag v2.4.2 | wc -c); git cat-file tag v2.4.2)|sha1sum

Это даст 29932f3915935d773dc8d52c292cadd81c81071d.

Ответ 2

Здесь немного путаницы. Git использует различные типы объектов: капли, деревья и коммиты. Следующая команда:

git cat-file -t <hash>

Сообщает вам тип объекта для заданного хэша. Таким образом, в вашем примере хеш 9eabf5b536662000f79978c4d1b6e4eff5c8d785 соответствует объекту фиксации.

Теперь, когда вы поняли себя, выполните следующее:

git cat-file -p 9eabf5b536662000f79978c4d1b6e4eff5c8d785

Дает вам содержимое объекта в соответствии с его типом (в данном случае - фиксацией).

Но это:

git hash-object fi

... вычисляет хэш для blob, содержимое которого является результатом предыдущей команды (в вашем примере), но это может быть что угодно (например, "hello world!" ). Здесь попробуйте следующее:

echo "blob 277\0$(cat fi)" | shasum

Вывод аналогичен предыдущей. Это в основном, как Git хеширует blob. Итак, хешируя fi, вы генерируете объект blob. Но, как мы видели, 9eabf5b536662000f79978c4d1b6e4eff5c8d785 является фиксацией, а не блобом. Таким образом, вы не можете использовать hash fi, чтобы получить тот же хеш.

Хеширование фиксации основано на нескольких других сведениях, которые делают его уникальным (например, коммиттер, автор, дата и т.д.). В следующей статье вы узнаете, что такое хеш-код фиксации:

Анатомия Git commit

Таким образом, вы можете получить один и тот же хеш, предоставив все данные, указанные в статье, с теми же значениями, что и в исходной фиксации.

Это может быть полезно также:

Git снизу вверх