Создать PDF на основе HTML-кода (iTextSharp, PDFSharp?)
Может ли библиотека PDFSharp - iTextSharp генерировать PDF файлы * учитывать форматирование HTML *? (жирный (сильный), интервал (br) и т.д.)
Раньше я использовал iTextSharp и грубо обрабатывался таким образом (код ниже):
string encodingMetaTag = "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />";
string htmlCode = "text <div> <b> bold </ b> or <u> underlined </ u> <div/>";
var sr = new StringReader (encodingMetaTag + htmlCode);
var pdfDoc = new Document (PageSize.A4, 10f, 10f, 10f, 0f);
var = new HTMLWorker htmlparser (pdfDoc);
PdfWriter.GetInstance (pdfDoc, HttpContext.Current.Response.OutputStream);
pdfDoc.Open ();
htmlparser.Parse (sr);
pdfDoc.Close ();
включен в соответствующую HTML-форму в документ PDF, посвященный объекту класса HTMLWorker.. так что с помощью PDFSharp? Имеет ли похожее решение PDFSharp?
Ответы
Ответ 1
Я знаю, что этот вопрос старый, но здесь чистый способ сделать это...
Вы можете использовать HtmlRenderer в сочетании с PDFSharp для этого:
Bitmap bitmap = new Bitmap(1200, 1800);
Graphics g = Graphics.FromImage(bitmap);
HtmlRenderer.HtmlContainer c = new HtmlRenderer.HtmlContainer();
c.SetHtml("<html><body style='font-size:20px'>Whatever</body></html>");
c.PerformPaint(g);
PdfDocument doc = new PdfDocument();
PdfPage page = new PdfPage();
XImage img = XImage.FromGdiPlusImage(bitmap);
doc.Pages.Add(page);
XGraphics xgr = XGraphics.FromPdfPage(doc.Pages[0]);
xgr.DrawImage(img, 0, 0);
doc.Save(@"C:\test.pdf");
doc.Close();
Некоторые люди сообщают, что окончательное изображение выглядит немного размытым, видимо, из-за автоматического сглаживания. Вот сообщение о том, как исправить это: http://forum.pdfsharp.com/viewtopic.php?f=2&t=1811&start=0
Ответ 2
Нет, PDFsharp в настоящее время не включает код для анализа HTML файлов.
Ответ 3
В проекте, который я разработал в прошлом году, я использовал wkhtmltopdf (http://wkhtmltopdf.org/) для создания pdf файла из html, затем я прочитал файл и верните его пользователю.
Он отлично работает для меня, и это может быть для вас идея...
Ответ 4
Старый вопрос, но ни один из вышеперечисленных не работал у меня. Затем я попробовал generatepdf
метод HtmlRenderer в комбинации pdfsharp. Надеюсь, поможет:
Вы должны установить nuget с именем HtmlRenderer.pdfsharp
.
var doc = TheArtOfDev.HtmlRenderer.PdfSharp.PdfGenerator.GeneratePdf("Your html in a string",PageSize.A4);
PdfPage page = new PdfPage();
XImage img = XImage.FromGdiPlusImage(bitmap);
doc.Pages.Add(page);
XGraphics xgr = XGraphics.FromPdfPage(doc.Pages[0]);
xgr.DrawImage(img, 0, 0);
doc.Save(Server.MapPath("test.pdf"));
doc.Close();
Ответ 5
Я знаю, что есть действительно старый вопрос, но я понимаю, что никто не говорит о точном методе визуализации HTML в PDF. Основываясь на моем тесте, я узнал, что для его успешного выполнения вам нужен следующий код.
Bitmap bitmap = new Bitmap(790, 1800);
Graphics g = Graphics.FromImage(bitmap);
XGraphics xg = XGraphics.FromGraphics(g, new XSize(bitmap.Width, bitmap.Height));
TheArtOfDev.HtmlRenderer.PdfSharp.HtmlContainer c = new TheArtOfDev.HtmlRenderer.PdfSharp.HtmlContainer();
c.SetHtml("Your html in a string here");
PdfDocument pdf = new PdfDocument();
PdfPage page = new PdfPage();
XImage img = XImage.FromGdiPlusImage(bitmap);
pdf.Pages.Add(page);
XGraphics xgr = XGraphics.FromPdfPage(pdf.Pages[0]);
c.PerformLayout(xgr);
c.PerformPaint(xgr);
xgr.DrawImage(img, 0, 0);
pdf.Save("test.pdf");
Существует еще один способ, но у вас могут быть проблемы с размером.
PdfDocument pdf = PdfGenerator.GeneratePdf(text, PageSize.A4);
pdf.Save("test.pdf");
Ответ 6
Если вам нужен простой синтаксический анализ в вашем приложении, и у вас есть контроль над вводом html, вы можете написать свою собственную библиотеку для этого.
Я создал один в одном из моих проектов, но, к сожалению, его пока нельзя разделить из-за пользовательских функций, связанных с конкретным приложением.
В принципе, вам нужно следовать следующей логике для реализации базового HTML для PDF:
- Простой HTML-анализ тегов
- Создайте логику для распознавания общих стилей, то есть полужирного, курсивного, левого, центрального и т.д. и создайте класс PDFSharp с этими свойствами и назначьте Para, который будет добавлен в качестве атрибутов стиля в HTML
- Обрабатывать теги таблицы и добавлять строки и столбцы в PDF
- Теги абзаца для добавления абзацев.
Я дал очень широкий обзор логики здесь, основываясь на моей реализации.
У вас может быть гораздо лучшая идея:)
Вы также можете обратиться:
Написание содержимого таблицы HTML в PDF-документ с помощью iTextSharp в asp.net
Ответ 7
HTML Renderer для PDF с использованием PdfSharp может генерировать PDF из HTML
- как изображение или
- как текст
перед вставкой в PDF.
Для рендеринга в качестве изображения, пожалуйста, обратитесь к коду из ответа Диего.
Чтобы сделать как текст, пожалуйста, обратитесь к приведенному ниже коду:
static void Main(string[] args)
{
string html = File.ReadAllText(@"C:\Temp\Test.html");
PdfDocument pdf = PdfGenerator.GeneratePdf(html, PageSize.A4, 20, null, OnStylesheetLoad, OnImageLoadPdfSharp);
pdf.Save(@"C:\Temp\Test.pdf");
}
public static void OnImageLoadPdfSharp(object sender, HtmlImageLoadEventArgs e)
{
var imgObj = Image.FromFile(@"C:\Temp\Test.png");
e.Callback(XImage.FromGdiPlusImage(imgObj));
}
public static void OnStylesheetLoad(object sender, HtmlStylesheetLoadEventArgs e)
{
e.SetStyleSheet = @"h1, h2, h3 { color: navy; font-weight:normal; }";
}
HTML-код
<html>
<head>
<title></title>
<link rel="Stylesheet" href="StyleSheet" />
</head>
<body>
<h1>Images
<img src="ImageIcon" />
</h1>
</body>
</html>
Ответ 8
Если вам нужна только определенная HTML-строка, записанная в PDF, но не остальные, вы можете использовать HtmlContainer
из TheArtOfDev HtmlRenderer. Этот фрагмент использует V 1.5.1
using PdfSharp.Pdf;
using PdfSharp;
using PdfSharp.Drawing;
using TheArtOfDev.HtmlRenderer.PdfSharp;
//create a pdf document
using (PdfDocument doc = new PdfDocument())
{
doc.Info.Title = "StackOverflow Demo PDF";
//add a page
PdfPage page = doc.AddPage();
page.Size = PageSize.A4;
//fonts and styles
XFont font = new XFont("Arial", 10, XFontStyle.Regular);
XSolidBrush brush = new XSolidBrush(XColor.FromArgb(0, 0, 0));
using (XGraphics gfx = XGraphics.FromPdfPage(page))
{
//write a normal string
gfx.DrawString("A normal string written to the PDF.", font, brush, new XRect(15, 15, page.Width, page.Height), XStringFormats.TopLeft);
//write the html string to the pdf
using (var container = new HtmlContainer())
{
var pageSize = new XSize(page.Width, page.Height);
container.Location = new XPoint(15, 45);
container.MaxSize = pageSize;
container.PageSize = pageSize;
container.SetHtml("This is a <b>HTML</b> string <u>written</u> to the <font color=\"red\">PDF</font>.<br><br><a href=\"http://www.google.nl\">www.google.nl</a>");
using (var measure = XGraphics.CreateMeasureContext(pageSize, XGraphicsUnit.Point, XPageDirection.Downwards))
{
container.PerformLayout(measure);
}
gfx.IntersectClip(new XRect(0, 0, page.Width, page.Height));
container.PerformPaint(gfx);
}
}
//write the pdf to a byte array to serve as download, attach to an email etc.
byte[] bin;
using (MemoryStream stream = new MemoryStream())
{
doc.Save(stream, false);
bin = stream.ToArray();
}
}
Ответ 9
Вы, ребята, слышали о этом. Я могу ответить очень поздно, но я подумал, что это помогает. Это очень просто и хорошо работает.
var htmlContent = String.Format("<body>Hello world: {0}</body>",
DateTime.Now);
var htmlToPdf = new NReco.PdfGenerator.HtmlToPdfConverter();
var pdfBytes = htmlToPdf.GeneratePdf(htmlContent);
Изменить. Я пришел сюда с вопросом о преобразовании HTML-кода в PDF с помощью "PDFSharp" и выяснил, что "PDFSharp" не может этого сделать, тогда я узнал о NReco, и это сработало для меня так Я чувствовал, что это может помочь кому-то, как я.
Ответ 10
Я рекомендую вам NReco.PdfGenerator, потому что у вас есть бесплатная и платная лицензия, и ее легко установить из nuget.
Главная страница: https://www.nrecosite.com/pdf_generator_net.aspx
Документация: https://www.nrecosite.com/doc/NReco.PdfGenerator/
Если вы хотите создать PDF из html файла, попробуйте:
String html = File.ReadAllText("main.html");
var htmlToPdf = new NReco.PdfGenerator.HtmlToPdfConverter();
htmlToPdf.GeneratePdf(html, null, "C:/Users/Tmp/Desktop/mapa.pdf");