Ответ 1
Существует синтаксический анализатор CSS, написанный в Javascript под названием JSCSSP
Я пытаюсь реализовать синтаксический анализ CSS в JavaScript, чтобы:
a {
color: red;
}
анализируется в объекте:
{
'a' {
'color': 'red'
}
}
Во-первых, есть ли JavaScript/jQuery библиотека, которую я могу использовать?
Моя реализация довольно простая, поэтому я уверен, что она не является безупречной. Например, он отлично работает для базового CSS, но для свойства типа:
background: url(data:image/png;base64, ....);
Он терпит неудачу, потому что я использую split(';')
для разделения пар property:value
. Здесь ;
встречается в value
, поэтому он также разбивается на эту точку.
Есть ли альтернативный способ сделать это?
Вот код:
parseCSS: function(css) {
var rules = {};
css = this.removeComments(css);
var blocks = css.split('}');
blocks.pop();
var len = blocks.length;
for (var i = 0; i < len; i++)
{
var pair = blocks[i].split('{');
rules[$.trim(pair[0])] = this.parseCSSBlock(pair[1]);
}
return rules;
},
parseCSSBlock: function(css) {
var rule = {};
var declarations = css.split(';');
declarations.pop();
var len = declarations.length;
for (var i = 0; i < len; i++)
{
var loc = declarations[i].indexOf(':');
var property = $.trim(declarations[i].substring(0, loc));
var value = $.trim(declarations[i].substring(loc + 1));
if (property != "" && value != "")
rule[property] = value;
}
return rule;
},
removeComments: function(css) {
return css.replace(/\/\*(\r|\n|.)*\*\//g,"");
}
Спасибо!
Существует синтаксический анализатор CSS, написанный в Javascript под названием JSCSSP
Вы можете легко использовать собственный CSSOM браузера для анализа CSS:
var rulesForCssText = function (styleContent) {
var doc = document.implementation.createHTMLDocument(""),
styleElement = document.createElement("style");
styleElement.textContent = styleContent;
// the style will only be parsed once it is added to a document
doc.body.appendChild(styleElement);
return styleElement.sheet.cssRules;
};
Для каждого возвращаемого правила вы можете посмотреть свойства в rule.style
. См. http://jsfiddle.net/v2JsZ/ для примера.
Чтобы написать самый безупречный синтаксический анализатор, следуйте точным правилам tokenization и CSS grammar, как определено в спецификации. Обратите внимание, что вам не нужно реализовывать спецификацию чернилами. Вы можете начать с небольших частей и CSS, с которыми вы, скорее всего, столкнетесь, а затем оттуда. Еще лучше, пропустите весь процесс в целом и займитесь решением @Matthew, если это не учебное упражнение.
Для JavaScript доступны различные лексические сканеры и генераторы парсера. Вся грамматика доступна на веб-сайте w3. Зачем перерабатывать, когда вы можете просто использовать это и генераторы парсеров для генерации парсера в JavaScript.
Правила создания CSS приведены ниже.
stylesheet
: [ CHARSET_SYM STRING ';' ]?
[S|CDO|CDC]* [ import [ CDO S* | CDC S* ]* ]*
[ [ ruleset | media | page ] [ CDO S* | CDC S* ]* ]*
;
import
: IMPORT_SYM S*
[STRING|URI] S* media_list? ';' S*
;
media
: MEDIA_SYM S* media_list LBRACE S* ruleset* '}' S*
;
media_list
: medium [ COMMA S* medium]*
;
medium
: IDENT S*
;
page
: PAGE_SYM S* pseudo_page?
'{' S* declaration? [ ';' S* declaration? ]* '}' S*
;
pseudo_page
: ':' IDENT S*
;
operator
: '/' S* | ',' S*
;
combinator
: '+' S*
| '>' S*
;
unary_operator
: '-' | '+'
;
property
: IDENT S*
;
ruleset
: selector [ ',' S* selector ]*
'{' S* declaration? [ ';' S* declaration? ]* '}' S*
;
selector
: simple_selector [ combinator selector | S+ [ combinator? selector ]? ]?
;
simple_selector
: element_name [ HASH | class | attrib | pseudo ]*
| [ HASH | class | attrib | pseudo ]+
;
class
: '.' IDENT
;
element_name
: IDENT | '*'
;
attrib
: '[' S* IDENT S* [ [ '=' | INCLUDES | DASHMATCH ] S*
[ IDENT | STRING ] S* ]? ']'
;
pseudo
: ':' [ IDENT | FUNCTION S* [IDENT S*]? ')' ]
;
declaration
: property ':' S* expr prio?
;
prio
: IMPORTANT_SYM S*
;
expr
: term [ operator? term ]*
;
term
: unary_operator?
[ NUMBER S* | PERCENTAGE S* | LENGTH S* | EMS S* | EXS S* | ANGLE S* |
TIME S* | FREQ S* ]
| STRING S* | IDENT S* | URI S* | hexcolor | function
;
function
: FUNCTION S* expr ')' S*
;
/*
* There is a constraint on the color that it must
* have either 3 or 6 hex-digits (i.e., [0-9a-fA-F])
* after the "#"; e.g., "#000" is OK, but "#abcd" is not.
*/
hexcolor
: HASH S*
;