Outlawif Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 Прочитать текст из док-файла потребует на порядок больше усилий, чем сама задача. Или на 2 порядка. Так что проще текст скопировать и вставить куда-то.
OlegRO Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 не без интернета и копирования! :bt:
Outlawif Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 Я могу написать павершелл скрипт, но это уже не 2 строчки ))
OlegRO Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 от заняться тебе нечем) лучше б для форума вставку видео с фб и инсты написал
Outlawif Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 заняться тебе нечем Та вообще-то есть... Но челенж же )) Не могу все равно приаттачить ps1 файл, но я написал )) Показать $word = New-Object -ComObject Word.application $document = $word.Documents.Open($pwd.Path + "\" + $args[0], $false, $true) $text = $document.Words | select -Property Text | Select-String -Pattern '[абвгдеёжзиклмнопрстуфхцчшщ0-9]+' | %{$_.Line.Replace('@{Text=', '').Replace('}', '').Trim()} | Sort | Get-Unique Write-Host 'Уникальных слов: ', $text.count Out-File -FilePath .\words.txt -InputObject $text -Encoding unicode Чтобы пользоваться, нужно открыть блокнот, скопировать туда код, сохранить как *.ps1 файл, потом запустить его, параметром передать имя док-файла (он должен лежать в той же директории). Подробные инструкции писать не мое, записал видео как пользоваться )) Видос по ссылке Работает медленно, потому что для открытия док-файла создает оболочку ворда и потом работает с его внутренними объектами. Но от размера файла быстродействие зависит не сильно, просто оверхед большой на этот ворд. И еще ньюанс - работает только с русским текстом, считает слова и буквы. Иностранные слова за слова не считает ) Можно усовершенствовать, но требования расплывчатые...
MaJ0r Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 Кстати, а продвинутые текстовые редакторы типа Notepad++, Sublime Text, Vim случайно не умеют подобное? В том же нотепаде есть поддержка регулярок и продвинутый поиск Может тут можно как-то посчитать
Outlawif Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 Чистой регуляркой у меня вышло только в питоне и си шарпе, даже жс с юникодом не справился, там пришлось дотачивать напильником. В жс \b не работает для юникода в регулярках и это все ломает. С английским текстом все куда проще, но мы хз что там за язык, мож вообще китайский, тогда надо править все скрипты ) Насколько сильная поддержка регулярок в этих ноутпадах я без понятия. Может и можно. Но это во-первых требует определенных навыков, во-вторых док-файлы это все не читает )
MaJ0r Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 во-вторых док-файлы это все не читает ) 0utlaw, ну мы уже пришли к мнению, что проще скопировать текст куда-то, чем костылить. Но ты завзятый и все равно накодил даже чтобы читать док файл. Маньяк короче
Outlawif Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 Щас еще Котик скажет что док файл надо найти сначала поиском в гугле и скачать его на машину без инета. Вот тут я конечно призадумаюсь ))
OlegRO Опубліковано: 17 квітня 2020 Опубліковано: 17 квітня 2020 не, doc разбит на дискетах поставь чтение с диска b:/
Рекомендовані повідомлення
Створіть акаунт або увійдіть у нього для коментування
Ви маєте бути користувачем, щоб залишити коментар
Створити акаунт
Зареєструйтеся для отримання акаунту. Це просто!
Зареєструвати акаунтУвійти
Вже зареєстровані? Увійдіть тут.
Увійти зараз