#1
Отправлено 11 September 2013 - 07:29 AM
При помощи которого можно встраивать в контент PDF документы и даже html страницы но у него один минус всё что вставляется им в контент не читается поисковыми роботами, то есть в коде выглядит примерно - так -
iframe id="blockrandom"
name="iframe"
src="http://sitr.ru/doc/price.pdf"
width="100%"
height="800"
scrolling="auto"
frameborder="1"
class="wrapper"
Вы скажете нет, эта PDF страница всё равно проиндексируется, так как pdf - сделан не картинкой а текстовый.
НО в индексе она будет как отдельный PDF фаил.
Вот а теперь тех.задача-
Нужно что бы скрипт налету считывал текстовое содержание документа pdf или html и встраивал его в страницу, (в текущую страницу)
Если кто то сможет это реализовать назовите цену
#2
Отправлено 11 September 2013 - 08:42 AM
#3
Отправлено 11 September 2013 - 09:01 AM
Как минимум нужно указать для какого движка.
Любой для вас удобный, это не принципиально
#4
Отправлено 11 September 2013 - 09:50 AM
#5
Отправлено 11 September 2013 - 10:16 AM
теория уже есть... осталась практикаВот, например, довольно интересная статья - http://security-corp...plyushkami.html
И всё же нужна реализация этого замысла... ну скажем под Joomla или .. это не важно, ради этого замысла готов на любую CMS перейти.
Устроит внедрение html станиц в контент
#6
Отправлено 11 September 2013 - 01:23 PM
PS. А зачем, собственно, "на лету"? Обрабатываемые PDF-ы сваливаются из космоса именно в момент загрузки страницы?
#7
Отправлено 11 September 2013 - 02:55 PM
Ну допустим - хостинг свой тупо - домашний комп я готов выделить, статический IP - Домен на парковке - и привязан к IP поднял веб-сервер и что далее....ИМХО, тут наиболее важным моментом является "разрешен exec на хостинге" или нет. Если да, то проблема решается путем выполнения внешней утилиты конвертации PDF-в-TXT, которых вагон и тележка под разные ОС. Если exec запрещен (а он обычно запрещен, если не выделенный сервер, где сам себе хозяин) - тогда надо писать свою библиотеку или искать готовую.
PS. А зачем, собственно, "на лету"? Обрабатываемые PDF-ы сваливаются из космоса именно в момент загрузки страницы?
Я не очень понял мысль....
У меня есть масса полезных уникальных PDF фаилов и ещё больше html страниц.
Идея в том, что бы вмонтировать их в CMS средствами вапера то есть в 3 щелчка, и по правым и левым блокам ЦМСки пустить рекламу.
Таким образом за день можно поднять 1000 страничный сайт с кучей рекламы.
Всё бы хорошо но мой уникальный контент который в PDF-ках не индекируется когда вмонтирован вапером в сайт.
Вот и как вариант - скрипт налету по другому ни как.
А конвертить ПДФ в текст, потом выдёргивать картинки, потом новая страница вставить, ровнять...... нет это не очень автоматизированный процесс.... у меня жизни не хватит ....
#8
Отправлено 11 September 2013 - 03:37 PM
Мысль проста - в Яндексе довольно большое количество описаний, как сделать искомое Вами "на лету" (я нашел штуки три разных за пять минут), но все упирается в исполнение из-под PHP внешнего бинарника-конвертера, которому подсовывается PDF-файл, а на выходе получается TXT-файл, который и обрабатывается дальше средствами PHP. В подавляющем большинстве случаев хостеры выполнение внешних программ не разрешают.Я не очень понял мысль...
Правда, везде речь только про текстовую составляющую PDF. Никаких картинок. Я очень сомневаюсь, что кто-то писал некоммерческую библиотеку, разбирающую PDF полностью по объектам и затем формирующую из нее полностью аналогичный по виду HTML. Собственно, я и коммерческой-то не нашел .
#9
Отправлено 21 September 2013 - 08:09 AM
Debenu Quick PDF Library is a powerful royalty-free PDF developer SDK for Windows and Mac used by thousands of developers for working with PDFs on all levels. Including a robust API with over 700 functions for use with C, C++, C#, Delphi (4 to XE4, PHP, Visual Basic, VB.NET, ASP, PowerBASIC, Pascal, Objective-C, Python and more, Debenu Quick PDF Library truly is the ultimate toolkit for project where you need to create, edit, secure, print, render, split, merge or manipulate PDF documents.
The library is available in ActiveX, DLL, LIB, Dylib (Mac) and Delphi editions. Single or multiple developer licenses can be purchased and a source code license is also available.
#10
Отправлено 21 September 2013 - 12:49 PM
Поделишься?коммерческая но, есть и народный вариант
Только оно под винду и мак, т.е. на обычном хостинге "на лету" применять будет довольно сложно, т.к. PHP работает через ActiveX.
Мне больше понравилась http://www.pdfmosaic.ru/features/, но оно тоже слабо применимо на хостинге, так что я сижу потихоньку пишу себе свою библиотеку на PHP, чтобы ковырять леграндовские каталоги, которые доступны только в PDF. Формат, конечно, трындец... Хорошо хоть, что описание открыто и доступно.