Конвертация PDF в DOC или RTF (1/3) [Форумы Balancer.Ru]

Alek #06.05.2004 19:36

Alek

опытный

Собственно как это сделать быстро и без затей?
Может есть специальная прога?

varban #06.05.2004 20:15

varban

администратор

★★★☆

Есть. Fine Reader!

Balancer #06.05.2004 20:19

Balancer

администратор

★★★★★

Adobe Acrobat. Открываешь и сохраняешь как текст

А файнридером я ещё толком ни разу не распознал PDF'ы

На картинках и элементах вёрстки ему башню срывает

Alek #07.05.2004 08:21

Alek

опытный

Файнридером я и делал. Трудности с картинками. Особенно если в них(в картинках) есть текст. Приходится ручками блоки выделять, а лень

semen #07.05.2004 09:31

semen

втянувшийся

☆

Adobe Acrobat. Открываешь и сохраняешь как текст

Угу, только будь готов к тому, что каждая строка обязательно станет отдельным абзацем. В принципе, лечится написанем вордового макроса для объединения абзацев и визуальным контролем.
Дальше, возможно нарушение порядка следования текста — какая-нить трехстрочная табличная врезка внизу страницы или вроде-бы простенький список может разбиться на самостоятельные элементы, которые вклинятся в самые разные места, а то и переползут на другую страницу. Не часто, но такое бывает, так что, опять же, проверка глазами.

Всякие PDF-примочки от verypdf.com или BCL тоже не панацея. Да, абзацы они объедиянют. Только далеко не всегда корректно, да и списки при этом зачастую сливаются, куча лишних пробелов, бардак со стилями... Или, как и заявляется, полностью сохраняют форматирование исходного документа. Только вот при этом каждая строка текста вставлется в рамку - и че потом с ними делать, если документ переводить надо?

Так что мы, в основном, используем всякий экспорт PDF->doc для оценки объемов при переводе презентаций (ppt->pdf->doc и считаем кол-во знаковв ворде).

А файнридером я ещё толком ни разу не распознал PDF'ы На картинках и элементах вёрстки ему башню срывает

Угу, была (?) такая проблема до 7-ой версии, но, вроде, исчезла. По крайней мере, за последний месяц-полтора пока не сталкивался (это где-то 20-30 PDF'ов разных объемов и степени сложности). А те несколько PDF'ок, на которые FR6 ругался при попытке импорта некоторых страниц, будучи для интереса подсунуты седьмому прошли на ура.
Ну, разве что, осталась проблема корректного разбиения на блоки: то файнридер пытается распознать меню на скриншоте, то с табличкой у него напряг выходит... Тут уж опять ручками и глазками.

На самом деле, эт для меня тож больная тема, так что буду рад услышать новые мысли

Alek #07.05.2004 14:54

Alek

опытный

У меня наверно акробат неправильный

Там нет функции сохранения в другом формате кроме PDF

А вот не пробывал ли кто прогу SolidConverter PDF 1.0 ?

Там около 15 мегов архив мне сложно это выкачать. Стоит ли?

Вот ЗДЕСЬ про нее прочитал

To semen - еще один переводчик в штат не требуется?

Alek #07.05.2004 15:13

Alek

опытный

Вот оказывается есть русская версия ЗДЕСЬ
Наверно завтра утром попробую скачать, все таки, и посмотреть что к чему.

Balancer #07.05.2004 15:20

Balancer

администратор

★★★★★

Alek, 07.05.2004 14:54:25 :
У меня наверно акробат неправильный
Там нет функции сохранения в другом формате кроме PDF

Ты Acrobat с Acrobat Reader ом не путаешь?

Вот, Adobe Acrobat 6.0
В меню "Save As" есть:

PDF
EPS
HTML 3.2
HTML 4 with CSS
JPEG
JPEG 2000
DOC
PNG
PS
RTF
TXT
TIFF
XML
XDP

Попробовал сохранить в TXT и HTML сложный трёхколоночный русский документ. Текст по колонкам поехал, но картиночки в HTML хорошо заэкспортировались

Alek #07.05.2004 16:20

Alek

опытный

Balancer, 07.05.2004 14:20:53 :
Ты Acrobat с Acrobat Reader ом не путаешь?

Да точно у меня Acrobat Reader, а он похоже только для чтения?

Вот еще забавный совет дали (я уже попробовал)

> pdf2html

adobe.com
> pdf2txt

adobe.com
> pdf2html

sun.trace.wisc.edu
> pdf2txt

sun.trace.wisc.edu

> Пишешь туда письмо, без темы, а в письме только URL pdf-файла.
> Пришлют конвертированный.
> это специальный робот и всякие hello не поймет

Vale #07.05.2004 22:51

Vale

Сальсолёт

★☆

Ghostscript, кажется, такое умеет. PDF->PS точно, а уж из PS ...

Bredonosec #08.05.2004 00:07

Bredonosec

аксакал

★★★★★

Насчет pdf2html - пробовал. Не знаю, как кому, может иногда и работала, у меня - в многостраничном (20стр) доке сделала только первую стр. со ссылками и всё. Далее, на ру-борде её неоднократно ругали, дескать, всё, что не понимает с налёту, сразу в картинки преображает. Сам после нескольких дней мучений потер эту пакость.
Правда, есть возможность, что говорим о разных прогах с одним названием. На той во время работы (конвертирования) в окошке(диалоге) лошадь скачущая была .

Для прикола вбил на кадете в поиск pdf, сразу 3 страницы результатов выкинуло. В смысле, софта с кряками. Взял на пробу пдф2ворд. Посмотрю, что скажет.

Kestrel #08.05.2004 00:52

Kestrel

опытный

☆

[quote|Vale, 07.05.2004 21:51:30 :]Ghostscript, кажется, такое умеет. PDF->PS точно, а уж из PS ...[/quote]

Ghostcript точно умеет. Только ты людям ссылку на виндовую версию подкинь, а то замучются ;-)

( я уже не помню откуда качал)

semen #08.05.2004 07:54

semen

втянувшийся

☆

Попробовал SolidConverter (2.0 build 100):
Очень порадовала возможность выбора режима преобразования, в т.ч. более-менее корректное объединение столбцов в одну колонку.
Недоработки с картинками — частенько пропускает, текст зачем-то на них отделяет. Не хватает, в общем, гибкости настройки в части обработки изображений.

А вот еще весьма неплохая тулза - Nothing found for Content Gemini . В ней особо примечатален режим разбиения PDF-странички на блоки для экспорта. Прям как в файнридере, только без косяков с распознаванием бежевого текста на светло-оранжевом фоне.

К сожалению пока не могу заставить ее полноценное работать без денег. Может найдется добрая душа помочь?

Bredonosec #17.05.2004 17:04

Bredonosec

аксакал

★★★★★

Вот еще забавный совет дали (я уже попробовал) Пишешь туда письмо, без темы, а в письме только URL pdf-файла.
> Пришлют конвертированный

Ща попробовал -
1. Русский текст не понимает.

Page 1 2
яЮМЙР-оЕРЕПАСПЦЯЙХИ ЦНЯСДЮПЯРБЕММШИ СМХБЕПЯХРЕР
м. щ. цНКЪМДХМЮ
лЕРНД цСЯЕМХЖЮ -SSA: ЮМЮКХГ БПЕЛЕММШУ ПЪДНБ

с В Е А М Н Е О Н Я Н А Х Е

яЮМЙР-оЕРЕПАСПЦ 2003 1

2. Формул (то, на что хватило бы тегов <sub>, <sup>, [small], [html_font face=symbol]) - не понимает - пишет только те переменные, что можно обозначить буквами латинницы нормального размера. остальное - ":"

Я B (X) = [ E 12( X) : : : : : E 12( X)]

Фактически, выглядит так, как экспорт в текст средствами самого акроридера, с добавлением

в начале и конце дока или

в начале каждого абзаца.

Итог - неприемлемо.

Bredonosec #17.05.2004 17:49

Bredonosec

аксакал

★★★★★

semen

К сожалению пока не могу заставить ее полноценное работать без денег. Может найдется добрая душа помочь?

попробуй
это
ЗЫ. просьба не светить снаружи форума - бо аккаунт прибьют.

Alesandro #17.05.2004 18:54

Alesandro
Серокой

координатор

★★★★

А как насчёт обратного проеобразования? Задача - перекрнвертитть виндовый хелп (.chm) в PDF. Проблема в том, что при печати Distiller не высвечивается в списке доступных принтеров.

Dem_anywhere #18.05.2004 17:35

Dem_anywhere

аксакал

★☆

Ну есть дофига других принтеров, которые в PDF печатают...

GrayCat #18.05.2004 19:30

GrayCat

координатор

☆

[quote|Alesandro, 17.05.2004 16:54:42 :]А как насчёт обратного проеобразования? Задача - перекрнвертитть виндовый хелп (.chm) в PDF.[/quote]

Попробовать проинсталлить [любой] PS-принтер, вывод направить в файл (получится *.PS), скормить его GhostScript-у...

TbMA #18.05.2004 19:48

TbMA

опытный

☆

Проверено - WinPDF печатает хелпы в pdf

Alesandro #18.05.2004 20:20

Alesandro
Серокой

координатор

★★★★

спасибо. Осталось найти программы.

Ушёл искать.

ab #18.05.2004 21:47

[quote|Alesandro, 17.05.2004 17:54:42 :]А как насчёт обратного проеобразования? Задача - перекрнвертитть виндовый хелп (.chm) в PDF.[/quote]

а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось.

Bredonosec #19.05.2004 00:34

Bredonosec

аксакал

★★★★★

CHM2PDF Pilot
_http://www.colorpilot.com/chm2pdf.html

Document2PDF Pilot
_http://www.colorpilot.com/document2pdf.html
Ошибка :: Компьютерный форум Ru.Board

CHM To PDF Converter is a program that easily and fast converts CHM (Compiled Help Filesl) files to PDF format. It converts automatically the CHM Table of Contents to PDF Outline and consolidates all associated topic files in a single PDF. It supports the usual PDF features, including compression and 128 bit encryption.
_http://www.theta-software.com/chmtopdf.htm

а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось

ABC Amber CHM Converter

Most likely, ABC Amber CHM Converter is a batch decompiler for Compiled Windows HTML Help files (*.chm) you've been searching for a long time. Taking CHM files or CHM ebooks, it will convert them to any document format you wish - PDF, RTF, HTML, DOC, TXT, MCW, etc.

_http://www.thebeatlesforever.com/processtext/abcchm.html

Balancer #19.05.2004 09:25

Balancer

администратор

★★★★★

[quote|ab, 18.05.2004 21:47:30 :]а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось.[/quote]

hh.exe -decompile filename.chm

Alesandro #19.05.2004 12:26

Alesandro
Серокой

координатор

★★★★

[quote|Bredonosec, 19.05.2004 00:34:35 :]CHM2PDF Pilot
_http://www.colorpilot.com/chm2pdf.html[/quote]

Спасибо.
Скачал, поставил. Картинки теряет, и подписи к ним тоже. Видать, что-то не учёл в настройках.
Разбираюсь...

ab #21.05.2004 22:50

[quote|Balancer, 19.05.2004 08:25:12 :][quote|ab, 18.05.2004 21:47:30 :]а chm как бы вообще должен обратно разбираться в html из-которого он был скомпилён. что-то для такого преобразования мне попадалось.[/quote]

hh.exe -decompile filename.chm[/quote]

ага, вспомнил. но чуть-чуть не так, надо еще и каталог куда декомпилить указать

hh -decompile folder chm

where -decompile is the switch, folder is the name of the destination folder where you want the decompiled files to be copied, and chm is the name of the compiled help file you want to decompile.

Конвертация PDF в DOC или RTF

опытный

администратор

администратор

опытный

втянувшийся

опытный

опытный

администратор

опытный

Сальсолёт

аксакал

опытный

втянувшийся

аксакал

аксакал

Alesandro Серокой

координатор

аксакал

координатор

опытный

Alesandro Серокой

координатор

аксакал

администратор

Alesandro Серокой

координатор

Alesandro
Серокой

Alesandro
Серокой

Alesandro
Серокой