Ответ 1
Попробуйте from bs4 import BeautifulSoup
Это может быть проблема с Beautiful Soup, версии 4 и бета-версиями. Я просто прочитал это с домашней страницы.
Я установил BeautifulSoup с помощью easy_install и попытался запустить следующий script
from BeautifulSoup import BeautifulSoup
import re
doc = ['<html><head><title>Page title</title></head>',
'<body><p id="firstpara" align="center">This is paragraph <b>one</b>.',
'<p id="secondpara" align="blah">This is paragraph <b>two</b>.',
'</html>']
soup = BeautifulSoup(''.join(doc))
print soup.prettify()
Но не знаю, почему это происходит.
Traceback (most recent call last):
File "C:\Python27\reading and writing xml file from web1.py", line 49, in <module>
from BeautifulSoup import BeautifulSoup
ImportError: No module named BeautifulSoup
Не могли бы вы помочь. Благодаря
Попробуйте from bs4 import BeautifulSoup
Это может быть проблема с Beautiful Soup, версии 4 и бета-версиями. Я просто прочитал это с домашней страницы.
В Ubuntu 14.04 я установил его из apt-get, и он отлично работал:
sudo apt-get install python-beautifulsoup
Затем просто выполните:
from BeautifulSoup import BeautifulSoup
Попробуй это, моя работала так. Чтобы получить любые данные тега, просто замените "a" тегом, который вы хотите.
from bs4 import BeautifulSoup as bs
import urllib
url="http://currentaffairs.gktoday.in/month/current-affairs-january-2015"
soup = bs(urllib.urlopen(url))
for link in soup.findAll('a'):
print link.string
вы можете импортировать bs4 вместо BeautifulSoup. Поскольку bs4 является встроенным модулем, дополнительная установка не требуется.
from bs4 import BeautifulSoup
import re
doc = ['<html><head><title>Page title</title></head>',
'<body><p id="firstpara" align="center">This is paragraph <b>one</b>.',
'<p id="secondpara" align="blah">This is paragraph <b>two</b>.',
'</html>']
soup = BeautifulSoup(''.join(doc))
print soup.prettify()
Если вы хотите запросить, используя модуль запросов.
запрос использует модули urllib
, requests
.
но я лично рекомендую использовать requests
модуль вместо urllib
установить модуль для использования:
$ pip install requests
Здесь, как использовать модуль запросов:
import requests as rq
res = rq.get('http://www.example.com')
print(res.content)
print(res.status_code)
если у вас есть две версии python, возможно, моя ситуация может помочь вам
это моя ситуация.
1- > mac osx
2- > У меня есть два варианта python, (1) системная версия по умолчанию 2.7 (2) вручную установлена версия 3.6
3- > я установил beautifulsoup4 с sudo pip install beautifulsoup4
4- > Запустите файл python с помощью python3 /XXX/XX/XX.py
так что эта ситуация 3 и 4 являются ключевой частью, у меня есть beautifulsoup4 с "pip", но этот модуль был установлен для python verison 2.7, и я запускаю файл python с "python3". поэтому вы должны установить beautifulsoup4 для python 3.6;
с помощью sudo pip3 install beautifulsoup4
вы можете установить модуль для python 3.6