Ошибка памяти в python

Traceback (most recent call last):
File "/run-1341144766-1067082874/solution.py", line 27, in 
main()
File "/run-1341144766-1067082874/solution.py", line 11, in main
if len(s[i:j+1]) > 0:
MemoryError
Error in sys.excepthook:
Traceback (most recent call last):
File "/usr/lib/python2.7/dist-packages/apport_python_hook.py", line 64, in apport_excepthook
from apport.fileutils import likely_packaged, get_recent_crashes
File "/usr/lib/python2.7/dist-packages/apport/__init__.py", line 1, in 
from apport.report import Report
MemoryError

Original exception was:
Traceback (most recent call last):
File "/run-1341144766-1067082874/solution.py", line 27, in 
main()
File "/run-1341144766-1067082874/solution.py", line 11, in main
if len(s[i:j+1]) > 0:
MemoryError

Вышеприведенные ошибки появились, когда я попытался запустить следующую программу. Может кто-нибудь объяснить, что такое ошибка памяти, и как решить эту проблему?, Программа принимает строки как входные данные и находит все возможные подстроки и создает из нее набор (в лексикографическом порядке), и он должен печатать значение в соответствующем индексе, заданном пользователем, иначе он должен печатать "Недействительный"

def main():
    no_str = int(raw_input())
    sub_strings= []
    for k in xrange(0,no_str):
        s = raw_input()
        a=len(s)
        for i in xrange(0, a):
            for j in xrange(0, a):
                if j >= i:
                    if len(s[i:j+1]) > 0:
                        sub_strings.append(s[i:j+1])
    sub_strings = list(set(sub_strings))
    sub_strings.sort()
    queries= int(raw_input())
    resul = []
    for i in xrange(0,queries):
        resul.append(int(raw_input()))
    for p in resul:
        try:
            print sub_strings[p-1]
        except IndexError:
            print 'INVALID'


if __name__ == "__main__":
   main()

Ответы

Ответ 1

Это здесь:

s = raw_input()
a=len(s)
for i in xrange(0, a):
    for j in xrange(0, a):
        if j >= i:
            if len(s[i:j+1]) > 0:
                sub_strings.append(s[i:j+1])

кажется очень неэффективным и дорогостоящим для больших строк.

Лучше сделать

for i in xrange(0, a):
    for j in xrange(i, a): # ensures that j >= i, no test required
        part = buffer(s, i, j+1-i) # don't duplicate data
        if len(part) > 0:
            sub_Strings.append(part)

Объект-буфер сохраняет ссылку на исходную строку и атрибуты начала и длины. Таким образом, не происходит ненужного дублирования данных.

Строка длины l имеет подстроки l*l/2 средней длины l/2, поэтому потребление памяти будет примерно равным l*l*l/4. С буфером он намного меньше.

Обратите внимание, что buffer() существует только в 2.x. 3.x имеет memoryview(), который используется несколько иначе.

Еще лучше было бы вычислить индексы и вырезать подстроку по запросу.

Ответ 2

Если вы получаете неожиданный MemoryError и думаете, что у вас должно быть достаточно ОЗУ, возможно, это связано с тем, что вы используете 32-разрядную установку python.

Простое решение, если у вас 64-разрядная операционная система, заключается в переключении на 64-разрядную установку python.

Проблема заключается в том, что 32-разрядный питон имеет доступ только к ~ 4 ГБ ОЗУ. Это может сократиться еще больше, если ваша операционная система 32-разрядная, из-за накладных расходов операционной системы.

Вы можете узнать больше о том, почему 32-битные операционные системы ограничены ~ 4 ГБ ОЗУ здесь: https://superuser.com/questions/372881/is-there-a-technical-reason-why-32-bit-windows-is-limited-to-4gb-of-ram

Ответ 3

A ошибка памяти означает, что в вашей программе закончилась нехватка памяти. Это означает, что ваша программа каким-то образом создает слишком много объектов.

В вашем примере вам нужно искать части вашего алгоритма, которые могут потреблять много памяти. Я подозреваю, что ваша программа получает очень длинные строки в качестве входных данных. Поэтому s[i:j+1] может быть виновником, так как он создает новый список. В первый раз, когда вы его используете, это не обязательно, потому что вы не используете созданный список. Вы можете попытаться выяснить, помогает ли следующее:

if  j + 1 < a:
    sub_strings.append(s[i:j+1])

Чтобы заменить второе создание списка, вы обязательно должны использовать объект buffer, как это было предложено glglgl.

Также обратите внимание, что, поскольку вы используете if j >= i:, вам не нужно запускать xrange в 0. Вы можете:

for i in xrange(0, a):
    for j in xrange(i, a):
        # No need for if j >= i

Более радикальной альтернативой было бы попытаться переработать ваш алгоритм, чтобы вы не предварительно вычислили все возможные подстроки. Вместо этого вы можете просто вычислить запрошенную подстроку.

Ответ 4

вы можете попытаться создать тот же самый script, который выдает эту ошибку, деля

Ответ 5

Я использую 64-битную систему 8 ГБ оперативной памяти и потому, что я написал

X = np.zeros((639642, 50, 159))

Я получаю ошибку памяти, и мой Python 3.6 является 64-битной версией. Пожалуйста помоги

Ответ 6

Использование python 64 бит решает много проблем.