Проверка текста на уникальность на яндекс: Отдельная проверка уникальности по Яндекс.Дзен

«Как проверить статью на уникальность?» — Яндекс Кью

Популярное

Сообщества

ЛитератураПисательство+3

Патман Кулик

  ·

4,2 K

ОтветитьУточнить

Олег Чувакин

Литература

1,3 K

Прозаик. Ведёт сайты «Счастье слова» и «Строгий редактор»  · 11 июл 2020  · seditor.pro

Есть сервис Content Watch. Платная версия и бесплатная (ограничение до 3 проверок в сутки и до 10000 знаков для каждого текста). Может не только отдельные тексты через окно проверять, но даже и целые сайты.

Лучше проверять текст через несколько сервисов. Через два — обязательно. Иногда и двух-трёх проверок бывает недостаточно. К примеру, копии текстов в соцсетях, в том числе открытые для просмотра, антиплагиатные машины находят далеко не всегда.

Разберу ваш рассказ, роман. Выправлю. Помогу с героями, сюжетом, композицией.

Перейти на olegchuvakin.ru/editor

Комментировать ответ…Комментировать…

Игорь Борисов

Маркетинг

13

Креативные технологии. Маркетологам, блогерам, журналистам, копирайтерам.  · 18 окт 2021

Недавно я поделился в Дзене своим списком инструментов для проверки грамотности текста https://bit.ly/3DO9Uft Но грамотности сегодня мало. Практически каждый текст публикуется в интернете. Автор, как правило, хочет, чтобы читатели текст нашли и прочитали. «Чтобы прочитали» — отдельная тема, связанная со сторителлингом и формулами типа AIDA. Первоочередная задача —… Читать далее

Комментировать ответ…Комментировать…

Алексей Бегин

Маркетинг

302

Блогер из Перми, рассказываю как вести текстовые блоги  · 18 апр 2022  · inclient. ru

Помните, как учительница в старших классах говорила: «Тебе голова зачем нужна? Правильно. Чтобы думать!».

Напишите статью своими словами, сдобрите собственными мыслями, идеями, советами, примерами из жизни.

Не штампуйте пластмассовый копипаст, создавайте свой контент.

Где вести блог в 2023 году? (+ как раскрутить блог и монетизировать контент)

Перейти на inclient.ru/best-blog-platforms

Комментировать ответ…Комментировать…

Георгий Кесов

661

Писатель, блогер. Автор сайта «Академия Писателей»  · 28 мая 2020  · litfan.ru

Здравствуйте! Есть множество как платных, так и бесплатных сервисов, с помощью которых Вы можете проверить статью на уникальность. Из бесплатного: Антиплагиат от Текст.ру — https://text.ru/antiplagiat (сам его использую) Из условно-бесплатного: Антиплагиат от Адвего — https://advego.com/antiplagiat/ У этих сервисов используется разный подход в выявлении плагиата, но.

.. Читать далее

Комментировать ответ…Комментировать…

Евробайт

67

Евробайт — надежный хостинг  · 20 апр 2021  · eurobyte.ru

Отвечает

Artem Harin

Список сервисов для проверки уникальности текста: 1. Text.ru — платформа, которая бесплатно позволяет проверить оригинальность текста в режиме онлайн. Помимо процента уникальности сервис показывает уровень водности, заспамленности ключевыми словами, длину текста. 2. Advego.com. Еще один популярный онлайн-сервис проверки на плагиат. К его плюсам можно отнести возможность… Читать далее

Евробайт — надежный и быстрый веб-хостинг для сайтов. От 144 ₽/мес.

Перейти на eurobyte.ru

Комментировать ответ…Комментировать…

Вы знаете ответ на этот вопрос?

Поделитесь своим опытом и знаниями

Войти и ответить на вопрос

Методы проверки на плагиат в Google и Яндексе

 Главная » Советы

Многие оптимизаторы и вебмастера нуждаются в проверки текстов на плагиат. Особенно это актуально для тех кто занимается рерайтом, а также для проверки отсканированного материала. Проверка на плагиат необходима, чтобы проверить текст на уникальность в Интернете, а также чтобы найти воров ваших текстов.

Существует огромное количество сервисов для проверки на плагиат, которые могут в сумме дать стопроцентный результат проверки. Рассмотрим каждый из них подробней.

1. Десктопная программа DCFinder (Double Content Finder). Является разработкой биржы покупки-продажи контента «Текстброкер». Ее очевидные преимущества — это малый размер (всего 400 kb) и возможность проверки тремя способами. Для проверки на плагиат вы можете добавить текст в форму проверки, или указать адрес проверяемой странички либо текстовый документ с готовым текстом. Данной программой я пользуюсь уже полгода и она меня ни разу не подводила, хотя качество проверки не самое лучшее.

2. Сервис Copyscape. Оценка проверяемости контента на плагиат достаточно высокая. Но есть один существенный недостаток — проверка осуществляется только с интернет страничек. Так что, если вы отсканировали текст с книг и вам необходимо проверить его на уникальность, то придется «заливать» файлы в Интернет.

Для этих целей можно воспользоваться бесплатными хостингами, куда будем заливать файлы. Но и тут есть недостаток — он способен проверять на плагиат только до 10 страниц в месяц с одного домена. Тут остается только использовать большое число своих собственных доменов, куда будем заливать до 10 проверяемых страниц в месяц.

Также существуют аналоги этого сервиса, но определяют они уникальность текстов намного хуже. Среди них antiplagiat.ru и pasteit.ru.

3. Третий способ самый простой и к тому же самый надежный. Будем проверять текст на уникальность через сами поисковики. Для этого берем небольшой кусок теста и заключаем его в кавычки. После этого вводим в форму поиска и нажимаем искать. Если ваш текст уникальный, то Яндекс или Google выдаст, что по данному запросу ничего не найдено. Приведу пример данной проверки В Яндексе — пример проверки на уникальность.

В Google проверка осуществляется аналогично.

P.S. До сих пор самый лучший уникальный контент — это статья написанная своими руками. Не бойтесь писать статьи и тогда не надо будет переживать за уникальность вашего контента. Для тех кто боится писать, подойдет статья «как научиться грамотно писать статьи«, в которой приводятся советы написания качественных статей на собственном опыте и опыте современных писателей.


Статьи по теме
  • Два полезных сервиса для вебмастера
  • Индексация нового сайта в поисковых системах
  • Панель Вебмастера: зло или добро?
  • Защищаем форум IPB от ботов
  • Продажа ссылок Sape или продажа постовых GogetLinks. Что выбрать?
Комментарии

Доберитесь до папки «Входящие» с помощью Litmus’ Spam Testing

Перейти к основному содержанию
  • Тестирование электронной почты

Если вы относитесь к почти 60% профессионалов в области электронного маркетинга, принявших участие в нашем опросе о состоянии электронной почты в 2021 году, вы вкладываете более двух недель в циклы создания своей электронной почты.

Но знаете ли вы, что 16% всех электронных писем никогда не попадают в папку «Входящие»?

Хотя доставка электронной почты иногда может казаться загадкой, вам не нужно скрещивать пальцы и надеяться, что ваши сообщения окажутся там, где вы хотели. С помощью Litmus Spam Testing вы можете выявлять и устранять проблемы, из-за которых ваши электронные письма могут попасть в спам, — задолго до того, как вы нажмете кнопку «Отправить».

Читайте дальше, чтобы узнать, почему проверки на спам так важны, что они могут помочь вам определить и как их проводить.

Что такое Лакмусовая проверка на спам?

Litmus Spam Testing сканирует ваши электронные письма с помощью 25+ различных тестов, выявляя любые проблемы, которые могут помешать вам попасть в папку «Входящие». Лучше всего то, что он дает действенные советы о том, как вы можете их исправить, прежде чем нажать кнопку «Отправить».

Узнайте, занесены ли вы в черный список

Обычно существует два типа черных списков: один на уровне интернет-протокола (IP), а другой на уровне домена (например, litmus. com и mail.litmus.com). ).

Черные списки предназначены для выявления IP-адресов и доменов, которые, как считается, рассылают спам. Как пользователь электронной почты, черный список отфильтровывает электронные письма, которые вы не хотите получать, поэтому вас не засыпают нежелательными сообщениями. Но как маркетолог электронной почты, нахождение в черном списке может означать, что ваши электронные письма не дойдут до ваших подписчиков.

Вот некоторые события, которые могут поместить вас в черный список:

  • Вы один из многих «отправителей», использующих общие IP-адреса вашего поставщика услуг электронной почты (ESP)
  • Получатели помечают вашу электронную почту как спам вместо того, чтобы отписываться от нее
  • Вы отправляете почту в устаревшие списки с неверными или недействующими адресами электронной почты
  •  Некоторые подписчики перестали открывать, нажимать и взаимодействовать с вашими сообщениями
  • Вы попасть в ловушку для спама

Внесение в черный список может произойти из-за множества факторов, которые вы можете (и должны) предотвратить, но важно знать, что не все они одинаково влияют на доставляемость.

Litmus Spam Testing сравнивает ваши IP-адреса и доменные имена с общими черными списками, указывает, фигурируете ли вы в них, и помогает определить приоритет вашего ответа с помощью флажка высокой или низкой значимости, который указывает, насколько важным может быть список для доставки вашей электронной почты.

Убедитесь, что инфраструктура настроена для успешной работы

Подтверждение того, что вы правильно аутентифицировали любой домен, который вы используете, является одним из самых основных шагов, которые вы можете предпринять, чтобы повысить вероятность того, что ваша электронная почта будет доставлена ​​туда, куда вы хотите. Наш инструмент проверки на спам позволяет легко проверить правильность работы ваших записей DomainKeys Identified Mail (DKIM), Sender Policy Framework (SPF) и Domain-based Message Authentication, Reporting & Conformance (DMARC).

Предварительно проверьте ваши сообщения с помощью основных спам-фильтров

Провести тест электронной почты на спам с помощью Litmus очень просто. После того, как вы вошли в свою учетную запись Litmus Plus или план Enterprise, вы можете выбрать «начать новый тест на спам» и скопировать список исходных адресов (уникальных для вас и теста). Затем отправьте электронное письмо со своего ESP на эти начальные адреса. Результаты тестирования вашей электронной почты появятся в Litmus менее чем за десять минут.

Или вы можете использовать синхронизацию ESP, чтобы выбрать электронное письмо из черновиков для отправки в Litmus при запуске нового теста на спам.

Получите актуальные советы по улучшению вашей электронной почты

После завершения проверки на спам вы получите визуальный обзор результатов, которые вернули проблему, и рейтинг того, насколько критична эта проблема для успеха вашей кампании. Вы также можете просмотреть отдельный тест, щелкнув соответствующий квадрат.

Кроме того, Litmus Spam Testing предлагает передовые методы, помогающие расставить приоритеты по техническим проблемам, которые необходимо решить перед отправкой, а также советы и рекомендации по более мелким проблемам, которые могут повлиять на размещение в папке «Входящие» (но не обязательно приведут к срыву вашей кампании по электронной почте) и тому, как чтобы решить их.

Какие спам-фильтры тестирует инструмент Litmus?

Многие факторы могут повлиять на доставляемость вашей электронной почты. Наш тест на спам дает вам представление о том, что может пометить вашу электронную почту как нежелательную. Вот основные фильтры, против которых он тестируется.

Аутентификация по электронной почте

Аутентификация по электронной почте проверяет подлинность источника электронной почты. Аутентификация по электронной почте, также называемая аутентификацией или проверкой домена, помогает предотвратить спуфинг и фишинг (например, электронные письма, которые должны выглядеть так, как будто они исходят от Amazon или вашего банка, но на самом деле таковыми не являются).

Вот некоторые проверки подлинности, которые рассматривает наш тест на спам в электронной почте:

  • Идентифицированная почта DomainKeys (DKIM). Показывает, что ваша электронная почта связана с вашим доменом. В свою очередь, это, по сути, позволяет вашей организации взять на себя ответственность за вашу электронную почту.
  • Аутентификация, отчетность и соответствие сообщений на основе домена (DMARC). Предназначен для борьбы с фишингом и помогает определить, пытается ли отправитель выдать себя за вас.
  • Список-Отписаться. Необязательный заголовок электронной почты, который позволяет легко и последовательно отказаться от подписки.
  • Структура политик отправителей (SPF). Позволяет владельцу домена указывать несколько IP-адресов или доменов, которые могут отправлять почту от их имени с помощью записи DNS TXT.
  • TLS. STARTTLS или оппортунистический TLS. Предоставляет отправителям возможность шифровать электронную почту при передаче.

Фильтры мест размещения 

Фильтры мест размещения оценивают электронные письма по набору критериев, которые со временем меняются. Эти фильтры рассматривают комбинацию взаимодействия, репутации, аутентификации, форматирования, а также триггеров контента и слов. Litmus Spam Testing проверяет вашу электронную почту по следующим фильтрам размещения:

  • AOL Mail
  • Freenet.de
  • Gmail
  • GMX
  • GoDaddy
  • G Suite
  • Mail.com
  • Mail.ru
  • Office 365
  • Outlook
  • Web.de
  • Yahoo
  • Яндекс

Оценка фильтров

Эти оценки показывают вероятность того, что инструмент спам-фильтра поймает ваше письмо и поместит его в чью-то папку для спама.

  • Барракуда. Barracuda Essentials for Email Security — это сложный инструмент для защиты от спама и анализа электронной почты, часто используемый крупными организациями.
  • Онлайн-защита Microsoft Exchange. Использует встроенный фильтр вредоносных программ и спама для оценки и оценки электронной почты.
  • Безопасность обмена сообщениями Broadcom. Антивирус и инструмент анализа спама, используемый организациями для защиты корпоративной электронной почты.
  • Outlook Desktop. Outlook поставляется со встроенным фильтром нежелательной почты, который со временем «изучает» спам.
  • SpamAssassin. Спам-фильтр с открытым исходным кодом, который анализирует заголовки и основной текст электронной почты с помощью анализа текста, байесовской фильтрации, черных списков DNS и баз данных совместной фильтрации.

Фильтры черного списка 

Черный список – это набор отправителей, которые считаются источниками спама или других злоупотреблений в электронной почте в режиме реального времени. Поставщики черных списков могут использовать комбинацию спам-ловушек, жалоб на спам и другие проприетарные источники данных в качестве критериев для добавления отправителя в черный список. Поставщики почтовых ящиков часто поддерживают свои собственные черные списки, используя их в сочетании с независимыми сторонними черными списками.

Почему важно проверять почту на спам?

Вы не можете посмотреть на электронное письмо и узнать, попадет ли оно в папку со спамом 

Чтобы избежать попадания в папку со спамом, требуется гораздо больше, чем отказ от использования определенных слов или символов в строке темы электронного письма. Существует так много проблем, которые потенциально могут привести вас к спаму, что вы не можете предсказать возможные проблемы вручную — от черных списков до содержимого электронной почты и различных оценок и весов, которые спам-фильтр использует, чтобы определить, является ли электронная почта спамом.

На самом деле, вслед за законопроектом о фильтрации электронной почты, в котором утверждалось, что политические сообщения электронной почты несправедливо помещаются в спам, Google сейчас ведет переговоры с законодателями об изучении пилотной программы, которая «обеспечит большую прозрачность доставляемости электронной почты, в то же время позволяя пользователям защитить свои почтовые ящики, отменив подписку или пометив электронные письма как спам».

Электронные письма в папке со спамом лишают вас возможности  

Почти 80 % маркетологов, ответивших на наш отчет о состоянии электронной почты за 2021 год, назвали электронную почту одним из трех наиболее важных маркетинговых каналов. Если ваши электронные письма попадают в папку со спамом, вы упустили всю эту возможность!

Защитите возможность доставки электронной почты и репутацию отправителя

Тестирование на спам может помочь вам обнаружить и исправить проблемы до отправки, защищая вашу электронную почту и репутацию отправителя.

Увеличьте свои шансы на привлечение подписчиков

Вы отправляете электронные письма, чтобы привлечь подписчиков с определенной целью. Но то, как они взаимодействуют с вашими сообщениями, также показывает, что провайдеры почтовых ящиков действительно хотят взаимодействовать с вашими сообщениями. Когда они знают, что вы являетесь доверенным отправителем, поставщики почтовых ящиков с большей вероятностью будут помещать ваши сообщения туда, куда вы хотите, — в папку «Входящие»!

Как вы интерпретируете результаты теста на спам?

После запуска теста на спам вы увидите общую сводку результатов. Отсюда вы можете углубиться в проблемы, которые были обнаружены.

  • Если фильтр показывает зеленый квадрат или говорит «Пройдено», все готово!
  • Если фильтр показывает желтый квадрат или отмечен как незначительная проблема, вы все равно можете продолжить отправку. Тем не менее, рекомендуется просмотреть, что пометил фильтр, чтобы вы могли отслеживать проблему. Нерешенные проблемы со временем могут стать критическими.
  • Если фильтр показывает красный квадрат или отмечен как критическая проблема, не нажимайте кнопку «Отправить», пока не устраните отмеченные проблемы. Когда вы нажмете, чтобы просмотреть результаты этого фильтра, вы увидите боковую панель с рекомендуемыми действиями. Вы можете привлечь человека, который управляет вашей инфраструктурой электронной почты, чтобы помочь вам решить проблемы, прежде чем вы продолжите отправлять электронные письма.

Как начать работу с Litmus Spam Testing

Если у вас уже есть учетная запись Litmus Plus или Enterprise, войдите в систему и перейдите на вкладку Test. Оттуда выберите «Просмотреть и создать тесты на спам» в меню ползунка.

Здесь вы сможете начать новую проверку на спам или просмотреть результаты последней.

Регулярно запускайте тесты на спам

Почтовые клиенты обновляются в среднем каждые 1,2 дня, и вы можете совершенно не знать об изменениях. Точно так же регулярно обновляются алгоритмы спам-фильтров. А иногда ваша команда ИТ или разработчиков может изменить IP-адрес, не осознавая, что это повлияет на электронную почту. Во всяком случае, проверка электронной почты на спам поможет вам быть в курсе!

Попадание в папку нежелательной почты не только вредит вашим маркетинговым кампаниям и репутации. Это обошлось вам в виде потраченных впустую ресурсов, упущенной выгоды и упущенных возможностей связаться с вашими подписчиками. В некоторых случаях может даже потребоваться нанять компанию, чтобы исправить вашу репутацию отправителя.

В рамках рабочих процессов электронной почты рекомендуется регулярно проводить тесты на спам, чтобы ваши почтовые кампании оставались активными и эффективными!

Попробуйте бесплатную проверку на спам в течение 7 дней

Впервые на Litmus? Подпишитесь на пробную версию Litmus Plus и попробуйте бесплатную проверку на спам в течение 7 дней. Вы также получите доступ к Litmus Test для пошаговой проверки всех важных элементов в вашей электронной почте, предварительному просмотру электронной почты во всех популярных клиентах и ​​устройствах, анализу данных с помощью электронной аналитики и многому другому.

ПОПРОБУЙТЕ БЕСПЛАТНО

Первоначально опубликовано 7 июня 2017 г. Беттиной Шпехт. Последнее обновление: 15 июля 2022 г.

Вам также может понравиться

Маркетинг по электронной почте стал лучше

python — Как получить уникальность из фрейма данных с помощью pandas?

спросил

Изменено 6 лет, 6 месяцев назад

Просмотрено 162 раза

у меня дф

 21-06-2016 06:25:09 upi88@yandex. ru ПОЛУЧИТЬ HTTP/1.1 Mozilla/5.0 (iPhone; ЦП iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/11D257 Safari/9537.53   200 application/json    2130    https://edge-chat.facebook.com/pull?channel=p_100006170407238&seq=27&clientid=1d67ca6e&profile=mobile&partition=-2&sticky_token=185&msgs_recv=27&qp=y&cb=1830997782&state=active&sticky_pool=frc3c09_chat- прокси&uid=100006170407238&viewer_uid=100006170407238&m_sess=&__dyn=1Z3p5wnE-4UpwDF3GAgy78qzoC6Erz8B0GxG9xu3Z0QwFzohxO3O2G2a1mwYxm48sxadwpVEy1qK78gwUx6&__req=79&__ajax__=AYlbtcBwGC2suZLI-J88V0PWa58vtQeG3YlQLydFRsAl6UwLSjsSpD7peu8mGl6NsHvd2zxfDcB6A0-XunBugUsYZ1lMYmUu97R43iV7XSfpyg&__user=100006170407238
22.06.2016 06:25:20 [email protected] POST HTTP/1.1 Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11D257 Safari/9537.53 200 приложений/x-javascript 20248 https://m.facebook.com/stories.php?aftercursor=MTQ2NjY2MzEwNToxNDY2NjYzMTA1Ojg6NzM0ODg0MDExMjAyNDY1MzA5NToxNDY2NjYyNzk1OjA%=3D&synctab=h_nor_1&_a
2016-06-23 06:25:25 upi88@yandex.
ru ПОДКЛЮЧИТЬ HTTP/1.1 Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11Д257 Сафари/9537,53 200 - 0 scontent.xx.fbcdn.net:443 2016-06-23 06:25:25 [email protected] ПОЛУЧИТЬ HTTP/1.1 Mozilla/5.0 (iPhone; ЦП iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11D257 Safari/9537.53 200 text/html 1105 https://m.facebook.com/xti.php?xt=2.qid.6299270070554694533%3Amf_story_key.343726573953754118%3Aei.AI%40ecf11fb3faf9c0b1f73ce2a 2016-06-24 06:25:25 [email protected] ПОДКЛЮЧЕНИЕ HTTP/1.1 Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11Д257 Сафари/9537,53 200 - 0 scontent.xx.fbcdn.net:443 25.06.2016 06:25:25 [email protected] ПОДКЛЮЧЕНИЕ HTTP/1.1 Mozilla/5.0 (iPhone; ЦП iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11D257 Safari/9537.53 200–0 scontent.xx.fbcdn.net:443 25.06.2016 06:25:25 lemuska@mail.
ru ПОДКЛЮЧЕНИЕ HTTP/1.1 Mozilla/5.0 (iPhone; ЦП iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11D257 Safari/9537.53 200–0 scontent.xx.fbcdn.net:443

Мне нужно получить уникальную дату для каждого ID (только год, месяц и число). Желаемый выход:

 [email protected] - 21.06.2016, 22.06.2016, 23.06.2016
[email protected] - 24.06.2016, 25.06.2016
 

Как я могу получить эту дату?

  • питон
  • панды

2

Вы можете сначала извлечь необходимую информацию из ваших дат:

 df['filtered date'] = [w[:10] for w in df['date']]
 

Затем вы используете «удаление дубликатов»:

 output = df[['id','отфильтрованная дата']].drop_duplicates()
 

Затем вы можете изменить порядок фрейма данных для ясности:

 output.sort_values(by['id','filtered date'],inplace = True)
 

Вы, наконец, получите такой вывод:

 id отфильтрованная дата
0 lemuska@mail. ru 2016-06-24
1 [email protected] 25.06.2016
3 [email protected] 21.06.2016
4 [email protected] 22.06.2016
5 [email protected] 23.06.2016
 

Pandas предоставляет функцию groupby для DataFrames, которая должна соответствовать вашим требованиям.

 # Создать кадр данных со случайными значениями
mail = ['[email protected]', '[email protected]', '[email protected]']
stime = datetime.strptime('2016-07-01 00:00:00', '%Y-%m-%d %H:%M:%S')
etime = datetime.strptime('2016-07-30 00:00:00', '%Y-%m-%d %H:%M:%S')
tdelta = etime - время
tdiff = tdelta.days * 24 * 60 * 60 + tdelta.seconds
df = pd.DataFrame({
    'почта': [выбор (почта) для _ в диапазоне (10)],
    'время': [stime + timedelta (секунды = диапазон значений (tdiff)) для _ в диапазоне (10)]
})
# Сгруппировать кадр данных по столбцу 'mail' и применить лямбда-выражение к
# преобразовать сгруппированный набор значений в уникальные значения времени.
r = df.groupby(by='mail').apply(lambda x: set(x['time'].values))
 

После этого вы сможете работать с результатом:

 print(r)
почта
alice@foo. com {2016-07-24T16:42:12.000000000, 2016-07-07T15:...
[email protected] {2016-07-13T18:53:07.000000000, 2016-07-04T06:...
[email protected] {2016-07-10T07:37:19.000000000, 2016-07-09T07:...
тип: объект
 

Вот однострочник (предположим, что дата и ID являются именами соответствующих столбцов)

 df.groupby('ID').apply(lambda x: (x['date'].str[ :10]).уникальный())
 

и его выход

 ID
[email protected] [2016-06-24, 2016-06-25]
[email protected] [21-06-2016, 22-06-2016, 23-06-2016]
тип: объект
 

Давайте прочитаем ваши образцы данных в:

 import pandas as pd
импортировать StringIO
df = pd.read_table(StringIO.StringIO("""2016-06-21 06:25:09 [email protected] ПОЛУЧИТЬ HTTP/1.1 Mozilla/5.0 (iPhone; процессор iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51 .2 (KHTML, например, Gecko) Версия/7.0 Mobile/11D257 Safari/9537.53 200 application/json 2130 https://edge-chat.facebook.com/pull?channel=p_100006170407238&seq=27&clientid=1d67ca6e&profile=mobile&partition=-2&sticky_token=185&msgs_recv =27&qp=y&cb=1830997782&state=active&sticky_pool=frc3c09_chat-proxy&uid=100006170407238&viewer_uid=100006170407238&m_sess=&__dyn=1Z3p5wnE-4UpwDF3GAgy78qzoC6Erz8B0GxG9xu3Z0QwFzohxO3O2G2a1mwYxm48sxadwpVEy1qK78gwUx6&__req=79&__ajax__=AYlbtcBwGC2suZLI-J88V0PWa58vtQeG3YlQLydFRsAl6UwLSjsSpD7peu8mGl6NsHvd2zxfDcB6A0-XunBugUsYZ1lMYmUu97R43iV7XSfpyg&__user=100006170407238
22. 06.2016 06:25:20 [email protected] POST HTTP/1.1 Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11Д257 Сафари/9537.53 200 application/x-javascript 20248 https://m.facebook.com/stories.php?aftercursor=MTQ2NjY2MzEwNToxNDY2NjYzMTA1Ojg6NzM0ODg0MDExMjAyNDY1MzA5NToxNDY2NjYyNzk1OjA%3D&tab=h_nor&__m_log_async__=1
2016-06-23 06:25:25 [email protected] ПОДКЛЮЧИТЬ HTTP/1.1 Mozilla/5.0 (iPhone; CPU iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11D257 Safari/9537.53 200–0 scontent.xx.fbcdn.net:443
2016-06-23 06:25:25 [email protected] ПОЛУЧИТЬ HTTP/1.1 Mozilla/5.0 (iPhone; ЦП iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11Д257 Сафари/9537,53 200 text/html 1105 https://m.facebook.com/xti.php?xt=2.qid.6299270070554694533%3Amf_story_key.343726573953754118%3Aei.AI%40ecf11fb3faf9c0b1f73ce2a74bc9f228
2016-06-24 06:25:25 [email protected] ПОДКЛЮЧЕНИЕ HTTP/1.1 Mozilla/5. 0 (iPhone; CPU iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11D257 Safari/9537.53 200–0 scontent.xx.fbcdn.net:443
25.06.2016 06:25:25 [email protected] ПОДКЛЮЧЕНИЕ HTTP/1.1 Mozilla/5.0 (iPhone; ЦП iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11Д257 Сафари/9537,53 200 - 0 scontent.xx.fbcdn.net:443
25.06.2016 06:25:25 [email protected] ПОДКЛЮЧЕНИЕ HTTP/1.1 Mozilla/5.0 (iPhone; ЦП iPhone OS 7_1_2, как Mac OS X) AppleWebKit/537.51.2 (KHTML, как Gecko) Версия/7.0 Mobile/ 11D257 Safari/9537.53 200–0 scontent.xx.fbcdn.net:443
"""), delim_whitespace=Истина, заголовок=Нет)
 

Вас интересует первый (индекс: 0) столбец, который является датой, и третий (индекс: 2), который является адресом электронной почты. Чисто для наглядности выделим их в новый фрейм данных:

 df2 = df[[0, 2]]
 

который сейчас:

 0 2
0 21.06.2016 [email protected]
1 22.06.2016 [email protected]
2 23.06.2016 upi88@yandex.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *