Найти наиболее часто используемую строку в массиве
У меня есть этот массив, например (размер является переменным):
x = ["1.111", "1.122", "1.250", "1.111"]
и мне нужно найти наибольшее значение commom ("1.111"
в этом случае).
Есть ли простой способ сделать это?
Tks заранее!
EDIT # 1: Спасибо всем за ответы!
EDIT # 2: Я изменил принятый ответ на основе Z.E.D. Информация. Еще раз спасибо!
Ответы
Ответ 1
Ruby < 2.2
#!/usr/bin/ruby1.8
def most_common_value(a)
a.group_by do |e|
e
end.values.max_by(&:size).first
end
x = ["1.111", "1.122", "1.250", "1.111"]
p most_common_value(x) # => "1.111"
Примечание: Enumberable.max_by
является новым с Ruby 1.9, но он был обращен к 1.8.7
Ruby >= 2.2
Ruby 2.2 вводит метод Object # сам, с помощью которого мы можем сделать код более кратким:
def most_common_value(a)
a.group_by(&:itself).values.max_by(&:size).first
end
Как патч обезьяны
Или как Enumerable#mode
:
Enumerable.class_eval do
def mode
group_by do |e|
e
end.values.max_by(&:size).first
end
end
["1.111", "1.122", "1.250", "1.111"].mode
# => "1.111"
Ответ 2
Один проход через хеш для накопления счетчиков. Используйте .max(), чтобы найти хеш-запись с наибольшим значением.
#!/usr/bin/ruby
a = Hash.new(0)
["1.111", "1.122", "1.250", "1.111"].each { |num|
a[num] += 1
}
a.max{ |a,b| a[1] <=> b[1] } # => ["1.111", 2]
или, сверните все это в одну строку:
ary.inject(Hash.new(0)){ |h,i| h[i] += 1; h }.max{ |a,b| a[1] <=> b[1] } # => ["1.111", 2]
Если вы хотите вернуть элемент обратно .first():
ary.inject(Hash.new(0)){ |h,i| h[i] += 1; h }.max{ |a,b| a[1] <=> b[1] }.first # => "1.111"
Первый пример, который я использовал, - это то, как это обычно делается в Perl. Второй - больше Ruby-ish. Оба работают со старыми версиями Ruby. Я хотел сравнить их, а также посмотреть, как решение Wayne ускорит процесс, поэтому я тестировал его с помощью теста:
#!/usr/bin/env ruby
require 'benchmark'
ary = ["1.111", "1.122", "1.250", "1.111"] * 1000
def most_common_value(a)
a.group_by { |e| e }.values.max_by { |values| values.size }.first
end
n = 1000
Benchmark.bm(20) do |x|
x.report("Hash.new(0)") do
n.times do
a = Hash.new(0)
ary.each { |num| a[num] += 1 }
a.max{ |a,b| a[1] <=> b[1] }.first
end
end
x.report("inject:") do
n.times do
ary.inject(Hash.new(0)){ |h,i| h[i] += 1; h }.max{ |a,b| a[1] <=> b[1] }.first
end
end
x.report("most_common_value():") do
n.times do
most_common_value(ary)
end
end
end
Здесь результаты:
user system total real
Hash.new(0) 2.150000 0.000000 2.150000 ( 2.164180)
inject: 2.440000 0.010000 2.450000 ( 2.451466)
most_common_value(): 1.080000 0.000000 1.080000 ( 1.089784)
Ответ 3
Вы можете отсортировать массив и затем перебрать его один раз. В цикле просто отслеживайте текущий элемент и количество раз, когда оно видно. Когда список закончится или элемент изменится, установите max_count == count
, если count > max_count
. И, конечно, отслеживайте, какой элемент имеет max_count
.
Ответ 4
Вы можете создать хэш-карту, в которой элементы массива хранятся как ключи, а их значения - количество раз, которое этот элемент появляется в массиве.
Псевдокод:
["1.111", "1.122", "1.250", "1.111"].each { |num|
count=your_hash_map.get(num)
if(item==nil)
hashmap.put(num,1)
else
hashmap.put(num,count+1)
}
Как уже упоминалось, сортировка может быть быстрее.
Ответ 5
Использование значения по умолчанию для хэшей:
>> x = ["1.111", "1.122", "1.250", "1.111"]
>> h = Hash.new(0)
>> x.each{|i| h[i] += 1 }
>> h.max{|a,b| a[1] <=> b[1] }
["1.111", 2]
Ответ 6
Он вернет самое популярное значение в массиве
x.group_by{|a| a }.sort_by{|a,b| b.size<=>a.size}.first[0]
IE:
x = ["1.111", "1.122", "1.250", "1.111"]
# Most popular
x.group_by{|a| a }.sort_by{|a,b| b.size<=>a.size}.first[0]
#=> "1.111
# How many times
x.group_by{|a| a }.sort_by{|a,b| b.size<=>a.size}.first[1].size
#=> 2