Как проверить, является ли строка числом (float)?
Каков наилучший способ проверить, может ли строка быть представлена в виде числа в Python?
Теперь у меня есть функция:
def is_number(s):
try:
float(s)
return True
except ValueError:
return False
Который, не только уродливый и медленный, кажется неуклюжим. Однако я не нашел лучшего метода, потому что вызов float
в основной функции еще хуже.
Ответы
Ответ 1
Что не только уродливо и медленно
Я бы оспорил оба.
Регулярное выражение или другой метод синтаксического анализа строк будет более уродливым и медленным.
Я не уверен, что все может быть быстрее, чем выше. Вызывает функцию и возвращает. Try/Catch не создает больших накладных расходов, поскольку наиболее распространенное исключение перехватывается без расширенного поиска кадров стека.
Проблема в том, что любая функция преобразования чисел имеет два вида результатов
- Номер, если номер действительный
- Код состояния (например, через errno) или исключение, показывающее, что не может быть проанализировано действительное число.
C (в качестве примера) взломает это несколькими способами. Python излагает это ясно и явно.
Я думаю, что ваш код для этого идеально подходит.
Ответ 2
Если вы ищете синтаксические (положительные, беззнаковые) целые числа вместо чисел с плавающей точкой, вы можете использовать функцию isdigit()
для строковых объектов.
>>> a = "03523"
>>> a.isdigit()
True
>>> b = "963spam"
>>> b.isdigit()
False
Строковые методы - isdigit()
: Python2, Python3
Есть также кое-что о строках Unicode, с которыми я не слишком знаком
Юникод - десятичный/десятичный
Ответ 3
TL; DR Лучшее решение - s.replace('.','',1).isdigit()
Я сделал некоторые тесты, сравнивающие разные подходы
def is_number_tryexcept(s):
""" Returns True is string is a number. """
try:
float(s)
return True
except ValueError:
return False
import re
def is_number_regex(s):
""" Returns True is string is a number. """
if re.match("^\d+?\.\d+?$", s) is None:
return s.isdigit()
return True
def is_number_repl_isdigit(s):
""" Returns True is string is a number. """
return s.replace('.','',1).isdigit()
Если строка не является числом, блок except выполняется довольно медленно. Но что более важно, метод try-except - единственный подход, который правильно обрабатывает научные обозначения.
funcs = [
is_number_tryexcept,
is_number_regex,
is_number_repl_isdigit
]
a_float = '.1234'
print('Float notation ".1234" is not supported by:')
for f in funcs:
if not f(a_float):
print('\t -', f.__name__)
Обозначение с плавающей запятой ".1234" не поддерживается:
- is_number_regex
scientific1 = '1.000000e+50'
scientific2 = '1e50'
print('Scientific notation "1.000000e+50" is not supported by:')
for f in funcs:
if not f(scientific1):
print('\t -', f.__name__)
print('Scientific notation "1e50" is not supported by:')
for f in funcs:
if not f(scientific2):
print('\t -', f.__name__)
Научная нотация "1.000000e + 50" не поддерживается:
- is_number_regex
- is_number_repl_isdigit
Научная нотация "1e50" не поддерживается:
- is_number_regex
- is_number_repl_isdigit
EDIT: результаты тестов
import timeit
test_cases = ['1.12345', '1.12.345', 'abc12345', '12345']
times_n = {f.__name__:[] for f in funcs}
for t in test_cases:
for f in funcs:
f = f.__name__
times_n[f].append(min(timeit.Timer('%s(t)' %f,
'from __main__ import %s, t' %f)
.repeat(repeat=3, number=1000000)))
где были протестированы следующие функции:
from re import match as re_match
from re import compile as re_compile
def is_number_tryexcept(s):
""" Returns True is string is a number. """
try:
float(s)
return True
except ValueError:
return False
def is_number_regex(s):
""" Returns True is string is a number. """
if re_match("^\d+?\.\d+?$", s) is None:
return s.isdigit()
return True
comp = re_compile("^\d+?\.\d+?$")
def compiled_regex(s):
""" Returns True is string is a number. """
if comp.match(s) is None:
return s.isdigit()
return True
def is_number_repl_isdigit(s):
""" Returns True is string is a number. """
return s.replace('.','',1).isdigit()
Ответ 4
Есть одно исключение, которое вы можете принять во внимание: строка "NaN"
Если вы хотите, чтобы is_number возвращал FALSE для "NaN", этот код не будет работать, поскольку Python преобразует его в свое представление числа, которое не является числом (говорить о проблемах с идентификацией):
>>> float('NaN')
nan
В противном случае, я должен поблагодарить вас за кусок кода, который я сейчас широко использую.:)
G.
Ответ 5
как насчет этого:
'3.14'.replace('.','',1).isdigit()
который вернет true, только если есть один или нет. в строке цифр.
'3.14.5'.replace('.','',1).isdigit()
вернет false
edit: просто увидел другой комментарий...
добавление a .replace(badstuff,'',maxnum_badstuff)
для других случаев может быть выполнено. если вы пропустите соль, а не произвольные приправы (ref: xkcd # 974), это будет хорошо: P
Ответ 6
Обновлено после того, как Alfe указал, что вам не нужно отдельно проверять float как сложные дескрипторы:
def is_number(s):
try:
complex(s) # for int, long, float and complex
except ValueError:
return False
return True
Ранее говорилось: есть ли некоторые редкие случаи, которые вам также могут понадобиться для проверки сложных чисел (например, 1 + 2i), которые не могут быть представлены с помощью float:
def is_number(s):
try:
float(s) # for int, long and float
except ValueError:
try:
complex(s) # for complex
except ValueError:
return False
return True
Ответ 7
Который, не только уродливый и медленный, кажется неуклюжим.
Это может занять некоторое время, но это питонический способ сделать это. Как уже отмечалось, альтернативы хуже. Но есть еще одно преимущество в этом: полиморфизм.
Центральная идея утиной печати заключается в том, что "если она ходит и разговаривает, как утка, то это утка". Что, если вы решите, что вам нужно подклассифицировать строку, чтобы вы могли изменить, как вы определяете, может ли что-то быть преобразовано в float? Или что, если вы решите полностью протестировать какой-либо другой объект? Вы можете делать это без изменения вышеуказанного кода.
Другие языки решают эти проблемы с помощью интерфейсов. Я сохраню анализ того, какое решение лучше для другого потока. Дело в том, что python определенно зависит от утиной печатной стороны уравнения, и вам, вероятно, придется привыкнуть к синтаксису, например, если вы планируете много программировать на Python (но это не значит вам это должно понравиться, конечно).
Еще одна вещь, которую вы, возможно, захотите принять во внимание: Python довольно быстро бросает и ломает исключения по сравнению со многими другими языками (в 30 раз быстрее, чем .NET). Черт возьми, сам язык даже создает исключения для передачи не исключительных нормальных условий программы (каждый раз, когда вы используете цикл for). Таким образом, я не стал бы слишком беспокоиться об аспектах производительности этого кода, пока вы не заметите существенную проблему.
Ответ 8
Для int
используйте это:
>>> "1221323".isdigit()
True
Но для float
нам нужны некоторые трюки;-). Каждое число с плавающей точкой имеет одну точку...
>>> "12.34".isdigit()
False
>>> "12.34".replace('.','',1).isdigit()
True
>>> "12.3.4".replace('.','',1).isdigit()
False
Также для отрицательных чисел просто добавьте lstrip()
:
>>> '-12'.lstrip('-')
'12'
И теперь мы получаем универсальный способ:
>>> '-12.34'.lstrip('-').replace('.','',1).isdigit()
True
>>> '.-234'.lstrip('-').replace('.','',1).isdigit()
False
Ответ 9
Просто Mimic С#
В С# существуют две различные функции, которые обрабатывают разбор скалярных значений:
- Float.Parse()
- Float.TryParse()
float.parse():
def parse(string):
try:
return float(string)
except Exception:
throw TypeError
Примечание. Если вам интересно, почему я изменил исключение на TypeError, здесь документацию.
float.try_parse():
def try_parse(string, fail=None):
try:
return float(string)
except Exception:
return fail;
Примечание. Вы не хотите возвращать логическое значение "False", потому что это еще тип значения. Нет лучше, потому что это указывает на сбой. Конечно, если вы хотите что-то другое, вы можете изменить параметр fail на все, что хотите.
Чтобы расширить float, чтобы включить "parse()" и "try_parse()", вам нужно будет обезвредить класс "float", чтобы добавить эти методы.
Если вы хотите уважать ранее существовавшие функции, код должен выглядеть примерно так:
def monkey_patch():
if(!hasattr(float, 'parse')):
float.parse = parse
if(!hasattr(float, 'try_parse')):
float.try_parse = try_parse
SideNote: Я лично предпочитаю называть это Monkey Punching, потому что кажется, что я злоупотребляю языком, когда я это делаю, но YMMV.
Применение:
float.parse('giggity') // throws TypeException
float.parse('54.3') // returns the scalar value 54.3
float.tryParse('twank') // returns None
float.tryParse('32.2') // returns the scalar value 32.2
И великий мудрец Пифон сказал Священному Престолу Шарпису: "Все, что вы можете сделать, я могу сделать лучше, я могу сделать что-нибудь лучше вас".
Ответ 10
Для строк не чисел, try: except:
на самом деле медленнее, чем регулярные выражения. Для строк допустимых чисел регулярное выражение работает медленнее. Таким образом, соответствующий метод зависит от вашего ввода.
Если вы обнаружите, что находитесь в привязке к производительности, вы можете использовать новый сторонний модуль под названием fastnumbers, который обеспечивает функция называется isfloat. Полное раскрытие, я автор. Я включил его результаты в тайминги ниже.
from __future__ import print_function
import timeit
prep_base = '''\
x = 'invalid'
y = '5402'
z = '4.754e3'
'''
prep_try_method = '''\
def is_number_try(val):
try:
float(val)
return True
except ValueError:
return False
'''
prep_re_method = '''\
import re
float_match = re.compile(r'[-+]?\d*\.?\d+(?:[eE][-+]?\d+)?$').match
def is_number_re(val):
return bool(float_match(val))
'''
fn_method = '''\
from fastnumbers import isfloat
'''
print('Try with non-number strings', timeit.timeit('is_number_try(x)',
prep_base + prep_try_method), 'seconds')
print('Try with integer strings', timeit.timeit('is_number_try(y)',
prep_base + prep_try_method), 'seconds')
print('Try with float strings', timeit.timeit('is_number_try(z)',
prep_base + prep_try_method), 'seconds')
print()
print('Regex with non-number strings', timeit.timeit('is_number_re(x)',
prep_base + prep_re_method), 'seconds')
print('Regex with integer strings', timeit.timeit('is_number_re(y)',
prep_base + prep_re_method), 'seconds')
print('Regex with float strings', timeit.timeit('is_number_re(z)',
prep_base + prep_re_method), 'seconds')
print()
print('fastnumbers with non-number strings', timeit.timeit('isfloat(x)',
prep_base + 'from fastnumbers import isfloat'), 'seconds')
print('fastnumbers with integer strings', timeit.timeit('isfloat(y)',
prep_base + 'from fastnumbers import isfloat'), 'seconds')
print('fastnumbers with float strings', timeit.timeit('isfloat(z)',
prep_base + 'from fastnumbers import isfloat'), 'seconds')
print()
Try with non-number strings 2.39108395576 seconds
Try with integer strings 0.375686168671 seconds
Try with float strings 0.369210958481 seconds
Regex with non-number strings 0.748660802841 seconds
Regex with integer strings 1.02021503448 seconds
Regex with float strings 1.08564686775 seconds
fastnumbers with non-number strings 0.174362897873 seconds
fastnumbers with integer strings 0.179651021957 seconds
fastnumbers with float strings 0.20222902298 seconds
Как вы можете видеть
-
try: except:
был быстрым для числового ввода, но очень медленным для недопустимого ввода
- regex очень эффективен, когда вход недействителен
-
fastnumbers
выигрывает в обоих случаях
Ответ 11
Я знаю, что это особенно старый, но я бы добавил ответ, который, как я полагаю, охватывает информацию, отсутствующую в самом высоком голосовом ответе, который может быть очень ценным для тех, кто найдет это:
Для каждого из следующих методов соедините их со счетчиком, если вам нужен какой-либо ввод, который будет принят. (Предполагая, что мы используем голосовые определения целых чисел, а не 0-255 и т.д.)
x.isdigit()
хорошо работает для проверки того, является ли x целым числом.
x.replace('-','').isdigit()
хорошо работает для проверки того, является ли x отрицательным. (Первая запись в первой позиции)
x.replace('.','').isdigit()
хорошо работает для проверки, является ли x десятичным.
x.replace(':','').isdigit()
хорошо работает для проверки, является ли x отношением.
x.replace('/','',1).isdigit()
хорошо работает для проверки того, является ли x дробной.
Ответ 12
Кастинг для float и catching ValueError, вероятно, самый быстрый способ, поскольку float() специально предназначен именно для этого. Все, что требует синтаксического анализа строк (regex и т.д.), Скорее всего, будет медленнее из-за того, что он не настроен для этой операции. Мои $0,02.
Ответ 13
Вы можете использовать строки Unicode, у них есть способ сделать именно то, что вы хотите:
>>> s = u"345"
>>> s.isnumeric()
True
Или:
>>> s = "345"
>>> u = unicode(s)
>>> u.isnumeric()
True
http://www.tutorialspoint.com/python/string_isnumeric.htm
http://docs.python.org/2/howto/unicode.html
Ответ 14
Этот ответ предоставляет пошаговое руководство, в котором функция с примерами для поиска строки:
- Положительное число
- Положительный/отрицательный - integer/float
- Как отбросить строки "NaN" (не число) при проверке номера?
Проверьте, является ли строка положительным целым числом
Вы можете использовать str.isdigit()
чтобы проверить, является ли данная строка положительным целым числом.
Примеры результатов:
# For digit
>>> '1'.isdigit()
True
>>> '1'.isalpha()
False
Проверьте, что строка положительная/отрицательная - integer/float
str.isdigit()
возвращает False
если строка является отрицательным числом или числом с плавающей точкой. Например:
# returns 'False' for float
>>> '123.3'.isdigit()
False
# returns 'False' for negative number
>>> '-123'.isdigit()
False
Если вы хотите также проверить отрицательные целые числа и float
, вы можете написать пользовательскую функцию, чтобы проверить ее как:
def is_number(n):
try:
float(n) # Type-casting the string to 'float'.
# If string is not a valid 'float',
# it'll raise 'ValueError' exception
except ValueError:
return False
return True
Пример прогона:
>>> is_number('123') # positive integer number
True
>>> is_number('123.4') # positive float number
True
>>> is_number('-123') # negative integer number
True
>>> is_number('-123.4') # negative 'float' number
True
>>> is_number('abc') # 'False' for "some random" string
False
Отбросьте строки "NaN" (не число) при проверке номера
Вышеупомянутые функции вернут True
для строки "NAN" (Not number), потому что для Python это допустимое значение float, представляющее его, не является числом. Например:
>>> is_number('NaN')
True
Чтобы проверить, является ли число "NaN", вы можете использовать math.isnan()
как:
>>> import math
>>> nan_num = float('nan')
>>> math.isnan(nan_num)
True
Или если вы не хотите импортировать дополнительную библиотеку, чтобы проверить это, вы можете просто проверить ее, сравнив ее с самим собой, используя ==
. Python возвращает False
когда nan
float сравнивается с самим собой. Например:
# 'nan_num' variable is taken from above example
>>> nan_num == nan_num
False
Следовательно, выше функция is_number
может быть обновлена, чтобы вернуть False
для "NaN"
следующим образом:
def is_number(n):
is_number = True
try:
num = float(n)
# check for "nan" floats
is_number = num == num # or use 'math.isnan(num)'
except ValueError:
is_number = False
return is_number
Пример прогона:
>>> is_number('Nan') # not a number "Nan" string
False
>>> is_number('nan') # not a number string "nan" with all lower cased
False
>>> is_number('123') # positive integer
True
>>> is_number('-123') # negative integer
True
>>> is_number('-1.12') # negative 'float'
True
>>> is_number('abc') # "some random" string
False
PS: Каждая операция для каждой проверки в зависимости от типа номера имеет дополнительные накладные расходы. Выберите версию функции is_number
которая соответствует вашим требованиям.
Ответ 15
Я хотел бы узнать, какой метод наиболее быстрый. В целом лучшие и наиболее последовательные результаты были заданы функцией check_replace
. Самые быстрые результаты были заданы функцией check_exception
, но только если исключение не было выпущено - это означает, что его код является наиболее эффективным, но накладные расходы на выброс исключения довольно велики.
Обратите внимание, что проверка на успешное выполнение является единственным методом, который является точным, например, это работает с check_exception
но две другие тестовые функции возвращают False для действительного float:
huge_number = float('1e+100')
Вот эталонный код:
import time, re, random, string
ITERATIONS = 10000000
class Timer:
def __enter__(self):
self.start = time.clock()
return self
def __exit__(self, *args):
self.end = time.clock()
self.interval = self.end - self.start
def check_regexp(x):
return re.compile("^\d*\.?\d*$").match(x) is not None
def check_replace(x):
return x.replace('.','',1).isdigit()
def check_exception(s):
try:
float(s)
return True
except ValueError:
return False
to_check = [check_regexp, check_replace, check_exception]
print('preparing data...')
good_numbers = [
str(random.random() / random.random())
for x in range(ITERATIONS)]
bad_numbers = ['.' + x for x in good_numbers]
strings = [
''.join(random.choice(string.ascii_uppercase + string.digits) for _ in range(random.randint(1,10)))
for x in range(ITERATIONS)]
print('running test...')
for func in to_check:
with Timer() as t:
for x in good_numbers:
res = func(x)
print('%s with good floats: %s' % (func.__name__, t.interval))
with Timer() as t:
for x in bad_numbers:
res = func(x)
print('%s with bad floats: %s' % (func.__name__, t.interval))
with Timer() as t:
for x in strings:
res = func(x)
print('%s with strings: %s' % (func.__name__, t.interval))
Вот результаты с Python 2.7.10 на MacBook Pro 201:
check_regexp with good floats: 12.688639
check_regexp with bad floats: 11.624862
check_regexp with strings: 11.349414
check_replace with good floats: 4.419841
check_replace with bad floats: 4.294909
check_replace with strings: 4.086358
check_exception with good floats: 3.276668
check_exception with bad floats: 13.843092
check_exception with strings: 15.786169
Вот результаты с Python 3.6.5 на MacBook Pro 201:
check_regexp with good floats: 13.472906000000009
check_regexp with bad floats: 12.977665000000016
check_regexp with strings: 12.417542999999995
check_replace with good floats: 6.011045999999993
check_replace with bad floats: 4.849356
check_replace with strings: 4.282754000000011
check_exception with good floats: 6.039081999999979
check_exception with bad floats: 9.322753000000006
check_exception with strings: 9.952595000000002
Ниже приведены результаты с PyPy 2.7.13 на MacBook Pro 201:
check_regexp with good floats: 2.693217
check_regexp with bad floats: 2.744819
check_regexp with strings: 2.532414
check_replace with good floats: 0.604367
check_replace with bad floats: 0.538169
check_replace with strings: 0.598664
check_exception with good floats: 1.944103
check_exception with bad floats: 2.449182
check_exception with strings: 2.200056
Ответ 16
Итак, чтобы собрать все вместе, проверив Nan, бесконечность и комплексные числа (казалось бы, они указаны с j, а не i, то есть 1 + 2j), это приводит к:
def is_number(s):
try:
n=str(float(s))
if n == "nan" or n=="inf" or n=="-inf" : return False
except ValueError:
try:
complex(s) # for complex
except ValueError:
return False
return True
Ответ 17
Допустим, у вас есть цифры в строке.
str = "100949"
и вы хотите проверить, есть ли у него только числа
if str.isdigit():
returns TRUE or FALSE
isdigit docs
в противном случае ваш метод отлично работает, чтобы найти появление цифры в строке.
Ответ 18
Ваш код выглядит хорошо для меня.
Возможно, вы считаете, что код "неуклюжий" из-за использования исключений? Обратите внимание, что программисты Python склонны использовать исключения либерально, когда улучшают удобочитаемость кода благодаря его низкой производительности.
Ответ 19
Я сделал несколько тестов скорости. Предположим, что если строка вероятна является числом, стратегия try/except является самой быстрой. Если строка не вероятна как число и, вас интересует проверка Integer, стоит сделать какой-то тест (isdigit plus heading '-').
Если вам интересно проверить число с плавающей запятой, вам нужно использовать escape/исключение кода без выхода.
Ответ 20
Мне нужно было определить, была ли строка передана в базовые типы (float, int, str, bool). После того, как я ничего не нашел в Интернете, я создал это:
def str_to_type (s):
""" Get possible cast type for a string
Parameters
----------
s : string
Returns
-------
float,int,str,bool : type
Depending on what it can be cast to
"""
try:
f = float(s)
if "." not in s:
return int
return float
except ValueError:
value = s.upper()
if value == "TRUE" or value == "FALSE":
return bool
return type(s)
Пример
str_to_type("true") # bool
str_to_type("6.0") # float
str_to_type("6") # int
str_to_type("6abc") # str
str_to_type(u"6abc") # unicode
Вы можете захватить тип и использовать его
s = "6.0"
type_ = str_to_type(s) # float
f = type_(s)
Ответ 21
Ввод может быть следующим:
a="50"
b=50
c=50.1
d="50.1"
1-Общий вход:
Ввод этой функции может быть любым!
Находит, является ли данная переменная числовой. Числовые строки состоят из необязательного знака, любого количества цифр, необязательной десятичной части и необязательной экспоненциальной части. Таким образом, +0123.45e6 является допустимым числовым значением. Шестнадцатеричная (например, 0xf4c3b00c) и двоичная (например, 0b10100111001) нотация не допускается.
is_numeric функция
import ast
import numbers
def is_numeric(obj):
if isinstance(obj, numbers.Number):
return True
elif isinstance(obj, str):
nodes = list(ast.walk(ast.parse(obj)))[1:]
if not isinstance(nodes[0], ast.Expr):
return False
if not isinstance(nodes[-1], ast.Num):
return False
nodes = nodes[1:-1]
for i in range(len(nodes)):
#if used + or - in digit :
if i % 2 == 0:
if not isinstance(nodes[i], ast.UnaryOp):
return False
else:
if not isinstance(nodes[i], (ast.USub, ast.UAdd)):
return False
return True
else:
return False
тестовое задание:
>>> is_numeric("54")
True
>>> is_numeric("54.545")
True
>>> is_numeric("0x45")
True
функция is_float
Находит, является ли данная переменная плавающей. Строки float состоят из необязательного знака, любого количества цифр,...
import ast
def is_float(obj):
if isinstance(obj, float):
return True
if isinstance(obj, int):
return False
elif isinstance(obj, str):
nodes = list(ast.walk(ast.parse(obj)))[1:]
if not isinstance(nodes[0], ast.Expr):
return False
if not isinstance(nodes[-1], ast.Num):
return False
if not isinstance(nodes[-1].n, float):
return False
nodes = nodes[1:-1]
for i in range(len(nodes)):
if i % 2 == 0:
if not isinstance(nodes[i], ast.UnaryOp):
return False
else:
if not isinstance(nodes[i], (ast.USub, ast.UAdd)):
return False
return True
else:
return False
тестовое задание:
>>> is_float("5.4")
True
>>> is_float("5")
False
>>> is_float(5)
False
>>> is_float("5")
False
>>> is_float("+5.4")
True
что такое аст?
2- Если вы уверены, что переменным содержимым является строка:
использовать метод str.isdigit()
>>> a=454
>>> a.isdigit()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
AttributeError: 'int' object has no attribute 'isdigit'
>>> a="454"
>>> a.isdigit()
True
3-числовой вход:
определить значение int:
>>> isinstance("54", int)
False
>>> isinstance(54, int)
True
>>>
обнаружить поплавок:
>>> isinstance("45.1", float)
False
>>> isinstance(45.1, float)
True
Ответ 22
РайанН предлагает
Если вы хотите вернуть False для NaN и Inf, измените строку на x = float (s); return (x == x) и (x - 1!= x). Это должно возвращать True для всех поплавков, кроме Inf и NaN
Но это не совсем работает, потому что для достаточно больших поплавок x-1 == x
возвращает true. Например, 2.0**54 - 1 == 2.0**54
Ответ 23
Я думаю, что ваше решение в порядке.
Сказав это, есть много ненависти регулярных выражений к этим ответам, которые я считаю неоправданными, регулярные выражения могут быть достаточно чистыми, правильными и быстрыми. Это действительно зависит от того, что вы пытаетесь сделать. Первоначальный вопрос заключался в том, как можно "проверить, можно ли представить строку в виде числа (с плавающей запятой)" (согласно вашему названию). Предположительно, вы захотите использовать числовое значение/значение с плавающей запятой после того, как вы проверите, что оно действительно, и в этом случае ваши попытки/кроме имеют большой смысл. Но если по какой-то причине вы просто хотите проверить, что строка является числом, тогда регулярное выражение также работает нормально, но его трудно получить правильно. Я думаю, что большинство ответов на регулярные выражения до сих пор, например, неправильно анализируют строки без целочисленной части (такой как ".7"), которая является плавающей точкой в том, что касается python. И это немного сложно проверить в одном регулярном выражении, где дробная часть не требуется. Я включил два регулярных выражения, чтобы показать это.
Это поднимает интересный вопрос о том, что такое "число". Вы включаете "inf", который является допустимым как float в python? Или вы включаете числа, которые являются "числами", но, возможно, не могут быть представлены в Python (например, числа, которые больше, чем максимум с плавающей точкой).
Там также двусмысленности в том, как вы анализируете числа. Например, что насчет "--20"? Это "число"? Это законный способ представлять "20"? Python позволит вам сделать "var = --20" и установить его равным 20 (хотя на самом деле это происходит потому, что он обрабатывает это как выражение), но float ("--20") не работает.
В любом случае, без дополнительной информации, здесь регулярное выражение, которое, как я считаю, охватывает все целые числа и числа с плавающей запятой, когда python анализирует их.
# Doesn't properly handle floats missing the integer part, such as ".7"
SIMPLE_FLOAT_REGEXP = re.compile(r'^[-+]?[0-9]+\.?[0-9]+([eE][-+]?[0-9]+)?$')
# Example "-12.34E+56" # sign (-)
# integer (12)
# mantissa (34)
# exponent (E+56)
# Should handle all floats
FLOAT_REGEXP = re.compile(r'^[-+]?([0-9]+|[0-9]*\.[0-9]+)([eE][-+]?[0-9]+)?$')
# Example "-12.34E+56" # sign (-)
# integer (12)
# OR
# int/mantissa (12.34)
# exponent (E+56)
def is_float(str):
return True if FLOAT_REGEXP.match(str) else False
Некоторые примеры тестовых значений:
True <- +42
True <- +42.42
False <- +42.42.22
True <- +42.42e22
True <- +42.42E-22
False <- +42.42e-22.8
True <- .42
False <- 42nope
Ответ 24
Вы можете использовать регулярное выражение.
number = raw_input("Enter a number: ")
if re.match(r'^\d+$', number):
print "It integer"
print int(number)
elif re.match(r'^\d+\.\d+$', number):
print "It float"
print float(number)
else:
print("Please enter a number")
Ответ 25
Я также использовал указанную вами функцию, но вскоре я заметил, что строки как "Нан", "Инф" и ее вариация считаются цифрами. Поэтому я предлагаю вам улучшенную версию вашей функции, которая вернет false для этих типов ввода и не выйдет из строя "1e3" вариантов:
def is_float(text):
try:
float(text)
# check for nan/infinity etc.
if text.isalpha():
return False
return True
except ValueError:
return False
Ответ 26
import re
def is_number(num):
pattern = re.compile(r'^[-+]?[-0-9]\d*\.\d*|[-+]?\.?[0-9]\d*$')
result = pattern.match(num)
if result:
return True
else:
return False
>>>: is_number('1')
True
>>>: is_number('111')
True
>>>: is_number('11.1')
True
>>>: is_number('-11.1')
True
>>>: is_number('inf')
False
>>>: is_number('-inf')
False
Ответ 27
Этот код обрабатывает показатели, числа с плавающей точкой и целые числа, без использования регулярных выражений.
return True if str1.lstrip('-').replace('.','',1).isdigit() or float(str1) else False
Ответ 28
Если вы хотите знать, может ли вся строка быть представлена в виде числа, вы хотите использовать regexp (или, возможно, преобразовать float в строку и сравнить ее с исходной строкой, но я предполагаю, что не очень быстро).
Ответ 29
Вот мой простой способ сделать это. Скажем, что я перебираю некоторые строки, и я хочу добавить их в массив, если они окажутся числами.
try:
myvar.append( float(string_to_check) )
except:
continue
Замените myvar.apppend любой операцией, которую вы хотите сделать с строкой, если она окажется числом. Идея состоит в том, чтобы попытаться использовать операцию float() и использовать возвращаемую ошибку, чтобы определить, является ли строка числом.
Ответ 30
Вы можете обобщить технику исключения полезным способом, возвращая более полезные значения, чем True и False. Например, эта функция ставит кавычки вокруг строк, но оставляет числа в одиночку. Это именно то, что мне нужно для быстрого и грязного фильтра, чтобы сделать некоторые определения переменных для R.
import sys
def fix_quotes(s):
try:
float(s)
return s
except ValueError:
return '"{0}"'.format(s)
for line in sys.stdin:
input = line.split()
print input[0], '<- c(', ','.join(fix_quotes(c) for c in input[1:]), ')'