Как сгенерировать последовательность дат с датой начала и окончания с использованием AWK сценариев BASH?
У меня есть набор данных со следующим форматом
Первое и второе поля обозначают даты (M/D/YYYY) начала и окончания исследования.
Как можно разложить данные в желаемый формат вывода, принимая во внимание високосные годы с использованием AWK или BASH скриптов?
Ваша помощь очень ценится.
Вход
7/2/2009 7/7/2009
2/28/1996 3/3/1996
12/30/2001 1/4/2002
Желаемый выход
7/7/2009
7/6/2009
7/5/2009
7/4/2009
7/3/2009
7/2/2009
3/3/1996
3/2/1996
3/1/1996
2/29/1996
2/28/1996
1/4/2002
1/3/2002
1/2/2002
1/1/2002
12/31/2001
12/30/2001
Ответы
Ответ 1
Если у вас gawk
:
#!/usr/bin/gawk -f
{
split($1,s,"/")
split($2,e,"/")
st=mktime(s[3] " " s[1] " " s[2] " 0 0 0")
et=mktime(e[3] " " e[1] " " e[2] " 0 0 0")
for (i=et;i>=st;i-=60*60*24) print strftime("%m/%d/%Y",i)
}
Демонстрация:
./daterange.awk inputfile
Вывод:
07/07/2009
07/06/2009
07/05/2009
07/04/2009
07/03/2009
07/02/2009
03/03/1996
03/02/1996
03/01/1996
02/29/1996
02/28/1996
01/04/2002
01/03/2002
01/02/2002
01/01/2002
12/31/2001
12/30/2001
Edit:
script выше имеет наивное предположение о длительности дней. Это незначительный nit, но при некоторых обстоятельствах это может привести к неожиданным результатам. По крайней мере, еще один ответ здесь также имеет эту проблему. Предположительно, команда date
с вычитанием (или добавлением) нескольких дней не имеет этой проблемы.
В некоторых ответах вам нужно знать количество дней вперед.
Вот еще один способ, который, надеюсь, решает эти проблемы:
while read -r d1 d2
do
t1=$(date -d "$d1 12:00 PM" +%s)
t2=$(date -d "$d2 12:00 PM" +%s)
if ((t2 > t1)) # swap times/dates if needed
then
temp_t=$t1; temp_d=$d1
t1=$t2; d1=$d2
t2=$temp_t; d2=$temp_d
fi
t3=$t1
days=0
while ((t3 > t2))
do
read -r -u 3 d3 t3 3<<< "$(date -d "$d1 12:00 PM - $days days" '+%m/%d/%Y %s')"
((++days))
echo "$d3"
done
done < inputfile
Ответ 2
Это можно сделать красиво только с bash:
for i in `seq 1 5`;
do
date -d "2017-12-01 $i days" +%Y-%m-%d;
done;
или с трубами:
seq 1 5 | xargs -I {} date -d "2017-12-01 {} days" +%Y-%m-%d
Ответ 3
Вы можете сделать это в оболочке без awk, предполагая, что у вас есть дата GNU (которая необходима для формы date -d @nnn
и, возможно, возможность разбивать ведущие нули на отдельные цифры дней и месяцев):
while read start end ; do
for d in $(seq $(date +%s -d $end) -86400 $(date +%s -d $start)) ; do
date +%-m/%-d/%Y -d @$d
done
done
Если вы находитесь в локали, которая делает экономию дневного света, тогда это может быть испорчено, если вы запрашиваете последовательность дат, когда между ними происходит переход на летнее время. Используйте -u для принуждения к UTC, который также строго соблюдает 86400 секунд в день. Вот так:
while read start end ; do
for d in $(seq $(date -u +%s -d $end) -86400 $(date -u +%s -d $start)) ; do
date -u +%-m/%-d/%Y -d @$d
done
done
Просто подайте этот ввод на stdin.
Вывод для ваших данных:
7/7/2009
7/6/2009
7/5/2009
7/4/2009
7/3/2009
7/2/2009
3/3/1996
3/2/1996
3/1/1996
2/29/1996
2/28/1996
1/4/2002
1/3/2002
1/2/2002
1/1/2002
12/31/2001
12/30/2001
Ответ 4
Я предпочитаю даты формата ISO 8601 - вот решение, использующее их.
Вы можете легко адаптировать его к американскому формату, если хотите.
AWK Script
BEGIN {
days[ 1] = 31; days[ 2] = 28; days[ 3] = 31;
days[ 4] = 30; days[ 5] = 31; days[ 6] = 30;
days[ 7] = 31; days[ 8] = 31; days[ 9] = 30;
days[10] = 31; days[11] = 30; days[12] = 31;
}
function leap(y){
return ((y %4) == 0 && (y % 100 != 0 || y % 400 == 0));
}
function last(m, l, d){
d = days[m] + (m == 2) * l;
return d;
}
function prev_day(date, y, m, d){
y = substr(date, 1, 4)
m = substr(date, 6, 2)
d = substr(date, 9, 2)
#print d "/" m "/" y
if (d+0 == 1 && m+0 == 1){
d = 31; m = 12; y--;
}
else if (d+0 == 1){
m--; d = last(m, leap(y));
}
else
d--
return sprintf("%04d-%02d-%02d", y, m, d);
}
{
d1 = $1; d2 = $2;
print d2;
while (d2 != d1){
d2 = prev_day(d2);
print d2;
}
}
Позвоните в этот файл: date.awk
Данные
2009-07-02 2009-07-07
1996-02-28 1996-03-03
2001-12-30 2002-01-04
Позвоните в этот файл: date.txt
Результаты
Выполненная команда:
awk -f dates.awk dates.txt
Вывод:
2009-07-07
2009-07-06
2009-07-05
2009-07-04
2009-07-03
2009-07-02
1996-03-03
1996-03-02
1996-03-01
1996-02-29
1996-02-28
2002-01-04
2002-01-03
2002-01-02
2002-01-01
2001-12-31
2001-12-30
Ответ 5
Другой вариант - использовать dateeq from dateutils (http://www.fresse.org/dateutils/#dateseq). -i
изменяет формат ввода, а -f
изменяет формат вывода. -1
должен указываться в качестве приращения, когда первая дата позже второй даты.
$ dateseq -i %m/%d/%Y -f %m/%d/%Y 7/7/2009 -1 7/2/2009
07/07/2009
07/06/2009
07/05/2009
07/04/2009
07/03/2009
07/02/2009
$ dateseq 2017-04-01 2017-04-05
2017-04-01
2017-04-02
2017-04-03
2017-04-04
2017-04-05