Извлечь ссылки из файла
Чаще всего отправлять и получать документы в формате PDF. Часто они содержат интересующую информацию, которую вы хотите сохранить, и ссылки, которые вы хотите ввести, но эти типы файлов редко редактируются. Если вы хотите узнать, как редактировать и извлекать все ссылки из документа PDF, читайте дальше!
Как упоминалось выше, наиболее распространенный способ отправки документов - в неповрежденном формате PDF или в восстановить или восстановить поврежденный PDF . Действительно, эти файлы совместимы со всеми операционными системами.
Особенность этого типа файлов заключается в том, что немногие позволяют скопировать его содержание . В случае, если вы хотите извлечь уникальную ссылку, это не проблема. Но если их много, это может оказаться довольно долгой и утомительной задачей. Но не волнуйтесь, существует множество программ, которые позволяют редактировать и извлекать все ссылки из PDF-документа.
Как извлечь актуальные адреса из гиперссылок в Excel?
Предположим, у вас есть диапазон ячеек, которые содержат гиперссылки, и теперь вам нужно увидеть реальное назначение гиперссылок и извлечь их из гиперссылок, как показано на следующем снимке экрана. Есть ли простые способы быстро решить эту проблему? Эта статья поможет вам извлечь фактические адреса из нескольких гиперссылок.
With Kutools for Excel’s Convert Hyperlinks feature, you can quickly extract the real URL addresses from the hyperlinks, at the same time, you can also convert the URL text to clickable hyperlinks.
Kutools for Excel: with more than 300 handy Excel add-ins, free to try with no limitation in 30 days. Download and free trial Now!
Извлекайте фактические адреса из гиперссылок с помощью функции редактирования гиперссылки
Здесь Изменить гиперссылку может помочь вам извлечь базовый URL-адрес для каждой из этих гиперссылок и поместить этот фактический адрес в другую ячейку. Вы можете сделать так:
1. Выберите ячейку с помощью гиперссылки и щелкните правой кнопкой мыши, в контекстном меню выберите Изменить гиперссылку, см. снимок экрана:
2, И Изменить гиперссылку появится диалоговое окно, выберите и скопируйте (Ctrl + C) весь URL из Адрес поле диалогового окна.
3. Затем закройте диалоговое окно и вставьте фактический адрес в любую ячейку, которую хотите.
Внимание: С помощью этого метода вы можете каждый раз извлекать только один адрес гиперссылки, но если у вас есть несколько гиперссылок, которые необходимо извлечь, вам нужно применять эту функцию повторно.
Извлекайте фактические адреса из гиперссылок с кодом VBA
Для большого количества гиперссылок вышеуказанный метод будет утомительным и трудоемким, поэтому следующий код VBA может помочь вам быстро извлечь несколько адресов из гиперссылок одновременно.
1. Удерживайте ALT + F11 , чтобы открыть Microsoft Visual Basic для приложений окно.
2. Нажмите Вставить > Модулии вставьте следующий код в окно модуля.
3, Затем нажмите F5 нажмите клавишу для запуска кода, и появится диалоговое окно для выбора гиперссылок, по которым вы хотите извлечь реальные адреса, см. снимок экрана:
4. Затем нажмите OK, и содержимое выбранной ячейки было преобразовано в реальные адреса гиперссылок в исходном диапазоне. Смотрите скриншоты:
Извлекайте фактические адреса из гиперссылок с помощью функции определения пользователя
Следующая функция, определяемая пользователем, также может извлекать фактический URl из гиперссылок.
1. Удерживайте ALT + F11 , чтобы открыть Microsoft Visual Basic для приложений окно.
2. Нажмите Вставить > Модулии вставьте следующий код в Окно модуля.
3. Сохраните код и закройте окно, выберите пустую ячейку, чтобы ввести эту формулу = GetURL (A2) (A2 это ячейка, в которой находится гиперссылка), и нажмите Enter кнопка. Вы можете видеть, что реальный адрес гиперссылки извлечен.
Извлекайте фактические адреса из гиперссылок с помощью Kutools for Excel быстро и легко
Если вы установили Kutools for Excel, пожалуйста, сделайте следующее:
1. Выберите диапазон, содержащий гиперссылки, которые необходимо извлечь.
2. Нажмите Кутулс > Ссылка > Конвертировать гиперссылки, см. снимок экрана:
3. В Конвертировать гиперссылки диалоговое окно, выберите Адреса гиперссылок заменяют содержимое ячейки и нажмите кнопка из Диапазон результатов указать ячейку, в которую будет помещен результат.
4, Затем нажмите OK, фактические адреса были извлечены из гиперссылок. Смотрите скриншот:
Внимание: Если вы хотите поместить фактические адреса в исходный диапазон, проверьте Преобразовать исходный диапазон.
Нажмите Конвертировать гиперссылки чтобы узнать больше об этой функции.
Демо: извлечение фактических адресов из гиперссылок с помощью Kutools for Excel
Kutools for Excel: с более чем 300 удобными надстройками Excel, которые можно попробовать бесплатно без ограничений в течение 30 дней. Загрузите и бесплатную пробную версию прямо сейчас!
Редактор PDF-ссылок
Если вам нужно извлечь несколько ссылок из документа PDF , не волнуйся, тебе не придется скопировать и вставить каждый из них в отдельности. Это приложение позволяет вам выполнять это действие намного проще. Вы также можете извлекать несколько ссылок одновременно для быстрого завершения.
Когда вы уже отметили выбранные ссылки, вы можете сохранить их в том же текстовом документе, чтобы они были доступны, когда они вам понадобятся.
Первый шаг для редактирования и извлечения всех ссылки на документы PDF with PDF Link Editor - скачать приложение. Вы можете легко получить его бесплатно в Интернете.
Затем откройте приложение и выберите PDF-файл для редактирования. Приложение покажет вам список ссылок, которые есть в файле, а также страницу, на которой находится каждая из них.
Вы можете извлечь его, вручную установив поле ссылки по вашему выбору или нажав на опцию "Выбрать все" . Затем настройте папку, в которую вы хотите заархивировать все извлеченные ссылки.
Чтобы завершить процесс выбора ссылок и сохранения конфигурации, все, что вам нужно сделать, это нажать кнопку «Извлечь ссылки», и приложение автоматически сохранит все выбранные ссылки в указанном пути к файлу.
Ссылки будут сохранены в текстовом файле, так что вы можете легко скопировать и вставить их в поисковую систему, когда они вам понадобятся.
Приложения для редактирования и извлечения всех ссылок из PDF-документа
Так же, как есть лучшие приложения для Android для открытия и просмотра файлов PDF, существует также понятие тех, которые позволяют вам изменять и извлекать их ссылки.
Приложения Информатика которые позволяют извлекать ссылки из PDF-документов, а также другие типы документов, например изображения. Познакомьтесь с некоторыми из них.
Однако, если вы случайно достигли этой стадии, помните, что вы все еще можете открывать, редактировать и конвертировать PDF-файлы на ПК легко и постепенно наполнять вас знаниями.
4 ответа
Попробуйте с этим:
Прежде всего, мы собираемся удалить все символы, которые не являются частью действительного URL, а также кавычки и пробелы. Это уберет смайлики, которые, кажется, вызывают проблему с ускорением регулярных выражений в блокноте ++ на некоторых обстоятельствах.
Наша первая замена будет:
Заменить на: (leave empty)
(Этот предыдущий шаг может не понадобиться в будущих версиях notepad ++)
После очистки мы делаем следующую замену:
Это должно работать даже с «текстовыми» атрибутами, которые имеют несколько ссылок внутри. URL будут разделены табуляторами.
Итак, после применения предыдущей процедуры к этим данным:
Может случиться так, что вы можете получить дублированные URL-адреса, если они дублируются на исходном вводе (с одинаковыми или разными атрибутами).
После обработки вы можете удалить дубликаты с помощью этого регулярного выражения:
Заменить на: (nothing)
В то время как другие ответы делают именно то, что вам нужно, следует отметить, что указанная вами строка является допустимой строкой JSON. Вы можете проверить, что это действительно JSON здесь.
Если вы имеете дело с этой строкой в программе, вы можете рассмотреть возможность использования анализатора JSON для вашего языка. Вот пример для Python
Чтобы извлечь только ссылки из текстового файла, выполните регулярное выражение Replace All, используя следующее:
Обратите внимание, что вам нужно проверить Wrap around , если точка вставки находится не в начале текста.
Объяснение:
При использовании «Заменить все» поиск и замена автоматически продолжаются до тех пор, пока регулярное выражение не будет соответствовать, начиная с последней точки, в которой данные были сопоставлены, до того времени, которое в этом случае было бы непосредственно перед двойной кавычкой в конце текущей ссылки, если Есть больше ссылок, или конец текста в противном случае.
Чтобы также извлечь отправителя, используйте следующее:
Объяснение:
Альтернативное регулярное выражение, чтобы сделать то же самое, но, вероятно, немного яснее:
Объяснение:
Шаг [1] работает, первоначально начиная с начала текста и захватывая все до первого ключа отправителя, затем захватывая ключ через [2], захватывая имя отправителя в [3], и захватывая все до связанной ссылки если он существует в [4]. Если нет связанной ссылки, происходит сбой [5], и регулярное выражение возвращается к шагу [1], который продолжает захватывать все после первого ключа отправителя до второго ключа отправителя. Этот цикл повторяется до тех пор, пока не будет найден ключ отправителя, с которым связана ссылка.
На этом этапе шаг [5] завершается успешно, а затем шаг [6] либо захватывает остальную часть текста, либо ничего.
Наконец, весь захваченный текст заменяется $1 $2\n\n , то есть именем отправителя, за которым следует пробел, ссылка и два символа новой строки.
Это завершает первую «замену». Поскольку выбрано «Заменить все», весь процесс начинается снова, но с указателем текста либо в двойных кавычках в конце ранее найденной ссылки, либо в конце текста, а не в начале.
Еще одной альтернативой будет анализ данных JSON.
Вы можете сделать это с помощью javascript.
Вы можете вставить этот javascript (изменяя yourJSON вместе с вашими данными) в какой-либо браузер, который имеет консоль javascript, например Firefox или Chrome. В Firefox вы можете запустить консоль с (Control + Shift + K) и в Chrome с (Control + Shift + I, затем нажмите «консоль»)
В качестве альтернативы вы можете использовать этот jsfiddle.
Отредактируйте квадрат javascript , чтобы использовать ваши данные, а затем нажмите кнопку «Выполнить».
В Excel мы всегда вставляем некоторые гиперссылки в ячейки, чтобы мы могли связать нужную нам информацию. Это полезно. Но при некоторых обстоятельствах вы можете столкнуться с некоторыми проблемами с гиперссылками, например, как вы можете извлечь URL-ссылки из сотен гиперссылок, как вы можете быстро превратить сотни обычных текстовых URL-адресов в гиперссылки и так далее. Вот почему мы строим Kutools for ExcelАвтора Конвертировать гиперссылки утилита. С помощью этой утилиты вы можете быстро выполнить следующие операции:
Вкладка Office позволяет редактировать и просматривать в Office с вкладками и значительно упрощает работу .
- Повторное использование чего угодно: Добавляйте наиболее часто используемые или сложные формулы, диаграммы и все остальное в избранное и быстро используйте их в будущем.
- Более 20 текстовых функций: Извлечь число из текстовой строки; Извлечь или удалить часть текстов; Преобразование чисел и валют в английские слова.
- Инструменты слияния : Несколько книг и листов в одну; Объединить несколько ячеек / строк / столбцов без потери данных; Объедините повторяющиеся строки и сумму.
- Разделить инструменты : Разделение данных на несколько листов в зависимости от ценности; Из одной книги в несколько файлов Excel, PDF или CSV; От одного столбца к нескольким столбцам.
- Вставить пропуск Скрытые / отфильтрованные строки; Подсчет и сумма по цвету фона ; Отправляйте персонализированные электронные письма нескольким получателям массово.
- Суперфильтр: Создавайте расширенные схемы фильтров и применяйте их к любым листам; Сортировать по неделям, дням, периодичности и др .; Фильтр жирным шрифтом, формулы, комментарий .
- Более 300 мощных функций; Работает с Office 2007-2019 и 365; Поддерживает все языки; Простое развертывание на вашем предприятии или в организации.
Нажмите Кутулс > Ссылка > Конвертировать гиперссылки. Смотрите скриншоты:
Извлечь URL-ссылки из нескольких гиперссылок
Предположим, что у вас есть диапазон гиперссылок на листе, как показано на снимке экрана ниже, вы можете быстро извлечь ссылки url из всех гиперссылок следующим образом. Смотрите скриншот:
1. Выберите диапазон, в котором вы хотите извлечь URL-ссылки из гиперссылок, а затем примените утилиту (щелкните Кутулс > Ссылка > Конвертировать гиперссылки).
2. в Конвертировать гиперссылки диалоговое окно, укажите нужные параметры.
(1). Он преобразует простые текстовые URL-ссылки в интерактивные гиперссылки.
(2). Он будет отображать фактический URL-адрес гиперссылок в ячейках, например, для извлечения URL-ссылки из гиперссылок.
(3). Укажите диапазон, в котором вы хотите применить операцию.
(4). Укажите ячейку, чтобы начать поиск результатов.
(5). Если вы не хотите помещать результаты в новый диапазон, проверьте Преобразовать исходный диапазон опцию.
3. Нажмите OK кнопку, чтобы применить операцию. Вы увидите следующие результаты. Смотрите скриншоты:
Размещение результатов в новом диапазоне.
Размещение результатов в исходном диапазоне.
Преобразование текстовых ссылок в интерактивные гиперссылки
Если у вас есть рабочий лист с сотнями URL-адресов в виде обычного текста, как показано на снимке экрана ниже, вы можете быстро превратить все URL-адреса в виде обычного текста в гиперссылки, доступные для нажатия, следующим образом. Смотрите скриншот:
1. Выберите диапазон, в котором вы хотите извлечь URL-ссылки из гиперссылок, а затем примените утилиту (щелкните Кутулс > Ссылка > Конвертировать гиперссылки).
2. в Конвертировать гиперссылки диалоговое окно, укажите нужные параметры.
(1). Он преобразует простые текстовые URL-ссылки в интерактивные гиперссылки.
(2). Он будет отображать фактический URL-адрес гиперссылок в ячейках, например, для извлечения URL-ссылки из гиперссылок.
(3). Укажите диапазон, в котором вы хотите применить операцию.
(4). Укажите ячейку, чтобы начать поиск результатов.
(5). Если гиперссылка связана с текущим документом, установите этот флажок.
(6). Если вы не хотите помещать результаты в новый диапазон, проверьте Преобразовать исходный диапазон опцию.
3. Нажмите OK кнопку, чтобы применить операцию. Вы увидите следующие результаты. Смотрите скриншоты:
Примечание:
Эта утилита поддерживает расстегивать (Ctrl + Z).
Демо
Kutools for Excel: с более чем 300 удобными надстройками Excel, которые можно попробовать бесплатно без ограничений в течение 30 дней. Загрузите и бесплатную пробную версию прямо сейчас!
Рекомендуемые инструменты для повышения производительности
Следующие ниже инструменты могут значительно сэкономить ваше время и деньги. Какой из них вам подходит?
Office Tab : Использование удобных вкладок в вашем офисе , как и в случае Chrome, Firefox и New Internet Explorer.
Kutools for Excel : Более 300 дополнительных функций для Excel 2021, 2019, 2016, 2013, 2010, 2007 и Office 365.
Элемент PDF
Еще один инструмент, который позволяет легко редактировать и извлекать все ссылки из документа PDF, - это элемент PDF. Он довольно прост в использовании и доступен бесплатно в Интернете для Windows и iOS.
Для начала вам необходимо скачать и открыть его. На его главном экране вы можете перетащить файл, с которым хотите работать, или перейти в меню » Файл "И выберите" открытый Чтобы найти PDF-документ в файловом браузере.
Основная особенность этой программы в том, что она позволяет добавлять и удалять ссылки в PDF-документе. Чтобы добавить ссылку, первое, что нужно сделать, это выбрать опцию " Модификатор »В главном меню. Затем вам нужно нарисовать прямоугольник вокруг текста, на который вы хотите добавить ссылку. Это действие откроет раскрывающееся меню. Там найдите раздел «Установите связь».
Если вместо этого вы хотите удалить ссылку, о которой идет речь, с опцией " редактировать »Выделите, заштрихуйте текст, где находится ссылка, и дважды щелкните по нему. Отобразится раскрывающееся меню, выберите параметр » Удалять Чтобы удалить ссылку, добавленную к этому тексту.
У меня есть текстовый файл, из которого я хочу извлечь ссылки.
Проблема в том, что в текстовом файле всего одна строка с множеством ссылок!
Или, что, когда я открываю его в блокноте, он показывает его во многих файлах, но не организован.
Просмотр и редактирование нескольких документов Word / книг Excel с вкладками в Firefox, Chrome, Internet Explore 10!
Возможно, вы знакомы с просмотром нескольких веб-страниц в Firefox / Chrome / IE и возможностью переключения между ними, легко щелкая соответствующие вкладки. Здесь вкладка Office поддерживает аналогичную обработку, которая позволяет вам просматривать несколько документов Word или книг Excel в одном окне Word или Excel и легко переключаться между ними, щелкая их вкладки.
Нажмите, чтобы получить бесплатную пробную версию вкладки Office!
Как выбрать и скопировать все гиперссылки из документа Word?
В некоторых случаях у вас есть длинный документ с несколькими гиперссылками, и вам нужно только скопировать сразу все гиперссылки из этого документа, а затем вставить их в другой. Есть ли способ быстро скопировать их все сразу вместо того, чтобы копировать их по одному?
Скопируйте все гиперссылки или только адреса в буфер обмена с помощью Kutools for Word
Скопируйте все гиперссылки с помощью VBA
1. Откройте документ Word, гиперссылки которого вы хотите скопировать, и нажмите Alt + F11 для открытия Окно приложения на основе Microsoft Visual.
2. Нажмите Вставить > Модули, и скопируйте следующий VBA в Window.
VBA: скопируйте все гиперссылки
3. Нажмите Run кнопку, чтобы запустить код VBA. Затем все гиперссылки копируются в новый документ. Вы можете сохранить новый документ позже. Вы можете увидеть результат следующим образом.
Примечание: Этот VBA может работать только тогда, когда все гиперссылки связаны со словом, если есть изображения с гиперссылками, этот код VBA не может работать.
Извлечь все адреса гиперссылок с помощью VBA
1. Откройте документ Word, в котором вы хотите извлечь гиперссылки, и нажмите Alt + F11 для открытия Окно приложения на основе Microsoft Visual.
2. Нажмите Вставить > Модули, и скопируйте следующий VBA в Window.
VBA: извлечь все адреса гиперссылок
3. Нажмите Run кнопку, чтобы запустить код VBA. Затем все адреса гиперссылок извлекаются в новый документ, вы можете сохранить его позже.
Примечание: Адреса гиперссылок извлечения находятся не в исходном порядке.
Скопируйте все гиперссылки или только адреса в буфер обмена с помощью Kutools for Word
Если вы хотите легко и быстро скопировать все гиперссылки или только адреса в буфер обмена из документа Word, Копировать гиперссылку полезности Kutools for Word могу оказать вам эту услугу.
После установки Kutools for Word, сделайте, как показано ниже: (Бесплатная загрузка Kutools for Word прямо сейчас!)
1. Нажмите Кутулс Плюс > Копировать гиперссылку.
2. В появившемся диалоговом окне выберите нужный вариант.
Теперь выберите одно место, где вы хотите разместить гиперссылки, нажмите Ctrl + V для их вставки.
Скопируйте и вставьте гиперссылки |
Скопируйте и вставьте адрес гиперссылки |
Демо: копирование гиперссылки
Kutools for Excel
Описанная выше функциональность - лишь одна из 300 мощных функций Kutools for Excel.
Предназначен для Excel(Office) 2021, 2019, 2016, 2013, 2010, 2007 и Office 365. Бесплатно скачать и использовать в течение 60 дней.
Читайте также: