PHP 7.4.0RC6 Released!

tidy::parseString

tidy_parse_string

(PHP 5, PHP 7, PECL tidy >= 0.5.2)

tidy::parseString -- tidy_parse_stringAnaliza un documento almacenado en una cadena

Descripción

Estilo orientado a objetos

public tidy::parseString ( string $input [, mixed $config [, string $encoding ]] ) : bool

Estilo por procedimientos

tidy_parse_string ( string $input [, mixed $config [, string $encoding ]] ) : tidy

Analiza un documento almacenado en una cadena.

Parámetros

input

Los datos a ser analizados.

config

La configuración config puede ser pasada en forma de un array o una cadena. Si una cadena es pasada, será interpretada como el el nombre del archivo de configuración, de otra forma, será interpretada como opciones en sí mismas.

Para una explicación de cada opción, consulte » http://tidy.sourceforge.net/docs/quickref.html.

encoding

El parámetro encoding establece la codificación para entarda/salida de los documentos. Los posibles valores de codificación son: ascii, latin0, latin1, raw, utf8, iso2022, mac, win1252, ibm858, utf16, utf16le, utf16be, big5, y shiftjis.

Valores devueltos

Devuelve una nueva instancia de tidy.

Ejemplos

Ejemplo #1 Ejemplo de tidy::parseString()

<?php
ob_start
();
?>

<html>
  <head>
   <title>test</title>
  </head>
  <body>
   <p>error<br>otra linea</i>
  </body>
</html>

<?php

$buffer 
ob_get_clean();
$config = array('indent' => TRUE,
                
'output-xhtml' => TRUE,
                
'wrap' => 200);

$tidy tidy_parse_string($buffer$config'UTF8');

$tidy->cleanRepair();
echo 
$tidy;
?>

El resultado del ejemplo sería:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
  <head>
    <title>
      test
    </title>
  </head>
  <body>
    <p>
      error<br />
      otra linea
    </p>
  </body>
</html>

Ver también

add a note add a note

User Contributed Notes 2 notes

up
1
steven at nevvix dot com
1 year ago
<?php
/**
* Simpler version without pretty print config options.
*/
function tidy_html5($html, array $config = [], $encoding = 'utf8') {
   
$config += [
       
'doctype' => '<!DOCTYPE html>',
       
'drop-empty-elements' => 0,
       
'new-blocklevel-tags' => 'article aside audio bdi canvas details dialog figcaption figure footer header hgroup main menu menuitem nav section source summary template track video',
       
'new-empty-tags' => 'command embed keygen source track wbr',
       
'new-inline-tags' => 'audio command datalist embed keygen mark menuitem meter output progress source time video wbr',
       
'tidy-mark' => 0,
    ];
   
$html = tidy_parse_string($html, $config, $encoding); // doctype not inserted
   
tidy_clean_repair($html); // doctype inserted
   
return $html;
}

$html = '</z><p><a href="#">Link</a></p><p><img src="logo.png"/>Seçond para</p><i class="fa"></i><p></p>';

echo
tidy_html5($html);

<!
DOCTYPE html>
<
html>
<
head>
<
title></title>
</
head>
<
body>
<
p><a href="#">Link</a></p>
<
p><img src="logo.png">Seçond para</p>
<
i class="fa"></i>
<
p></p>
</
body>
</
html>

echo
tidy_html5($html, ['indent'=>2, 'indent-spaces'=>4]);

<!
DOCTYPE html>
<
html>
<
head>
    <
title></title>
</
head>
<
body>
    <
p><a href="#">Link</a></p>
    <
p><img src="logo.png">Seçond para</p><i class="fa"></i>
    <
p></p>
</
body>
</
html>

echo
tidy_html5($html, ['indent'=>1], 'ascii');

<!
DOCTYPE html>
<
html>
  <
head>
    <
title></title>
  </
head>
  <
body>
    <
p>
      <
a href="#">Link</a>
    </
p>
    <
p>
      <
img src="logo.png">Se&Atilde;&sect;ond para
   
</p><i class="fa"></i>
    <
p></p>
  </
body>
</
html>

echo
tidy_html5($html, ['show-body-only'=>1]);

<
p><a href="#">Link</a></p>
<
p><img src="logo.png">Seçond para</p>
<
i class="fa"></i>
<
p></p>
up
0
steven at nevvix dot com
1 year ago
<?php
/**
* UTF-8 HTML5-compatible Tidy
*
* @param string $html
* @param array $config
* @param string $encoding
* @link http://tidy.sourceforge.net/docs/quickref.html
*/
function tidy_html5($html, array $config = [], $encoding = 'utf8') {
   
$config += [
       
'clean'       => TRUE,
       
'doctype'     => 'omit',
       
'indent'      => 2, // auto
       
'output-html' => TRUE,
       
'tidy-mark'   => FALSE,
       
'wrap'        => 0,
       
// HTML5 tags
       
'new-blocklevel-tags' => 'article aside audio bdi canvas details dialog figcaption figure footer header hgroup main menu menuitem nav section source summary template track video',
       
'new-empty-tags' => 'command embed keygen source track wbr',
       
'new-inline-tags' => 'audio command datalist embed keygen mark menuitem meter output progress source time video wbr',
    ];
   
$html = tidy_parse_string($html, $config, $encoding);
   
tidy_clean_repair($html);
    return
'<!DOCTYPE html>' . PHP_EOL . $html;
}

$html = '</z><p><a href="#">Link</a></p><p>Second para</p>';
echo
tidy_html5($html);

Output:
<!
DOCTYPE html>
<
html>
<
head>
  <
title></title>
</
head>
<
body>
  <
p><a href="#">Link</a></p>
  <
p>Second para</p>
</
body>
</
html>
To Top