Преобразование имени домена в название компании?
Есть ли способ/онлайн-сервис/база данных для преобразования доменного имени, такого как maxmind.com, в название компании Max Mind Inc.?
Если нет, может ли кто-нибудь предложить логический программный способ подойти к проблеме?
Я думал о следующих строках:
- Возьмите доменное имя
- Посетите веб-сайт - попробуйте найти название компании (не знаете, как это сделать?)
- Сделайте Whois. Если название компании доступно, используйте (возможно, не всегда).
Любые предложения?
Ответы
Ответ 1
Волосатый вопрос!
В некоторых случаях запрос WHOIS не будет впечатляюще: общие серверы, Akamai или другие CDN, домены, не связанные с корпорацией, и т.д. Я пришел из фона веб-агентства, и я могу сказать вам, что большой (два цифры) процент компаний не заботится о владении всеми своими доменными именами - они позволяют веб-агентству справляться с этим, особенно в отношении небольших промо-сайтов.
Моим лучшим советом было бы это. Получите домашнюю страницу или карту сайта, если она доступна. Найдите символ авторского права. Это может быть в ограниченном числе форм: "& copy;", "(c)", "©". Также формой заявления обычно является либо компания (c) год ", либо" (c) компания года ". Из этого вы можете получить компанию.
Он не будет работать во всех случаях, но, скорее всего, ваш лучший вариант.
Ответ 2
Я бы совпадал с предложением Sklivvz, по крайней мере, с тегом проверки тегов заголовков и, по возможности, с документами Whois.
Если вы проанализируете уведомление об авторских правах на stackoverflow.com, вы либо закончите с "stackoverflow.com", либо "stackoverflow.com LLC", и это не имеет никакого отношения.
В примере maxmind.com, если вы разбираете юридическое уведомление "Copyright © 2009 MaxMind, Inc.", вы либо закончите с "MaxMind", либо "MaxMind, Inc.", если вы комбинируете с тегом заголовка "Geolocation и Online Fraud Prevention от MaxMind", единственным словом, которое появляется в обоих местах, является MaxMind.
Также domaintools.com разбивает доменное имя на слова (каждый может изменить его, хотя), вы можете проанализировать эту страницу и получить "настоящее" имя, некоторые примеры:
http://whois.domaintools.com/maxmind.com = Max Mind
http://whois.domaintools.com/dabbledb.com = Dabble Db
http://whois.domaintools.com/domaintools.com = Domain Tools
http://whois.domaintools.com/stackoverflow.com = Stack Overflow
http://whois.domaintools.com/joelonsoftware.com = Joel On Software
aboutus.org также может быть очень хорошей ссылкой, когда можно:
http://aboutus.org/maxmind.com = MaxMind LLC
http://aboutus.org/dabbledb.com = ...
http://aboutus.org/domaintools.com = DomainTools.com
http://aboutus.org/stackoverflow.com = Qaru AG
http://aboutus.org/joelonsoftware.com = Fog Creek Software Inc.
Ответ 3
Ознакомьтесь с API Clearbit, который может получить название компании от имени домена: https://clearbit.com/#features
Также приходит в голову ссылка LinkedIn.
Ответ 4
2) Я думаю, что точка 2 невозможна. название страницы не всегда содержит название компании. и другие элементы могут быть в другом месте страницы (если на самом деле есть тег с именем компании, а не только изображением). веб-интерфейс является динамическим для такого поиска.
3) действительно ли есть страница компании без соответствующей записи whois?
существует много доменов от частных лиц (без имени компании). блог в собственном домене является таким образцом. вы найдете имя зарегистрированного лица на whois, но вы не знаете, является ли этот человек автором страницы.
зачем вам такая услуга и не только использовать имя домена?