Ответ 1
Вы должны использовать команду shuf
= =
cat file1 file2 | shuf
Или с Perl:
cat file1 file2 | perl -MList::Util=shuffle -wne 'print shuffle <>;'
У меня есть файлы в Linux. Например, 2 и мне нужно перетасовать файлы в один файл.
Например
$cat file1
line 1
line 2
line 3
line 4
line 5
line 6
line 7
line 8
и
$cat file2
linea one
linea two
linea three
linea four
linea five
linea six
linea seven
linea eight
И позже, когда я перетасовываю два файла, я могу получить что-то вроде:
linea eight
line 4
linea five
line 1
linea three
line 8
linea seven
line 5
linea two
linea one
line 2
linea four
line 7
linea six
line 1
line 6
Вы должны использовать команду shuf
= =
cat file1 file2 | shuf
Или с Perl:
cat file1 file2 | perl -MList::Util=shuffle -wne 'print shuffle <>;'
Сортировка: (аналогичные строки будут объединены)
cat file1 file2 | sort -R
Шуфа:
cat file1 file2 | shuf
Perl:
cat file1 file2 | perl -MList::Util=shuffle -e 'print shuffle<STDIN>'
BASH:
cat file1 file2 | while IFS= read -r line
do
printf "%06d %s\n" $RANDOM "$line"
done | sort -n | cut -c8-
Awk:
cat file1 file2 | awk 'BEGIN{srand()}{printf "%06d %s\n", rand()*1000000, $0;}' | sort -n | cut -c8-
Просто заметьте пользователям OS X, которые используют MacPorts: команда shuf
является частью coreutils
и устанавливается под именем gshuf
.
$ sudo port install coreutils
$ gshuf example.txt # or cat example.txt | gshuf
Здесь однострочный, который не полагается на shuf
или sort -R
, который у меня не был на моем mac:
while read line; do echo $RANDOM $line; done < my_file | sort -n | cut -f2- -d' '
Это итерация по всем строкам в my_file
и перепечатка их в рандомизированном порядке.
Вам здесь не нужны трубы. Сортировка сама по себе делает это с файлом (файлами) в качестве параметров. Я бы просто сделал
sort -R file1
или если у вас несколько файлов
sort -R file1 file2
Я бы использовал shuf
.
другой вариант, сортировка gnu имеет:
-R, --random-sort
sort by random hash of keys
вы можете попробовать:
cat file1 file2|sort -R
Это сработало для меня. Он использует Shuffle Fisher-Yates.
randomize()
{
arguments=("[email protected]")
declare -a out
i="$#"
j="0"
while [[ $i -ge "0" ]] ; do
which=$(random_range "0" "$i")
out[j]=${arguments[$which]}
arguments[!which]=${arguments[i]}
(( i-- ))
(( j++ ))
done
echo ${out[*]}
}
random_range()
{
low=$1
range=$(($2 - $1))
if [[ range -ne 0 ]]; then
echo $(($low+$RANDOM % $range))
else
echo "$1"
fi
}
Это явно смещенный ранд (примерно половина времени, когда список начинается с первой строки), но для некоторой базовой рандомизации с использованием только встроенных команд bash, я думаю, это нормально? Просто напечатайте каждую строку да/нет, затем напечатайте остальные...
shuffle() {
local IFS=$'\n' tail=
while read l; do
if [ $((RANDOM%2)) = 1 ]; then
echo "$l"
else
tail="${tail}\n${l}"
fi
done < $1
printf "${tail}\n"
}