Tf что такое – Карты памяти TF — что это такое и зачем они нужны?

Содержание

Карты памяти TF — что это такое и зачем они нужны?

Особенности, сферы применения, характеристики и отличия карт памяти TF и microSD.

Карты памяти стандарта TF (TransFlash) появились на рынке в 2004 году. Они используются для увеличения памяти в электронных гаджетах: цифровых фотоаппаратах, смартфонах, видеорегистраторах, игровых приставках и других гаджетах. Через некоторое время их название изменилось на Secure Digital: microSD и miniSD. Таким образом:

  • Карты памяти TF и SD полностью взаимозаменяемы.
  • Стандартный размер карт — 15x11x1 мм.
  • Объем памяти начинается от 126 Мб.

Карта памяти TF

В картах памяти стандарта TF используется система защиты содержимого от изменения или удаления. Неавторизованные пользователи не смогут получить доступ к информации, которая хранится на съемном носителе. Данные защищены с помощью функции управления цифровыми правами.

TF-карты могут работать в режиме, который используется только для чтения данных на съемном носителе. В этом случае информацию с устройства нельзя удалять или копировать, потому что есть возможность установки пароля на карту памяти.

Различия между картами памяти TF и SD

Карты памяти стандарта Secure Digital (microSD) поддерживают режим SDIO, который дает возможность работать через GPS, Bluetooth и NFC. Также у SD-карт установлено большее количество транзисторов. Максимальный объем памяти карт стандарта TransFlash — 128 ГБ, Secure Digital — 2 ТБ. Скорость чтения и передачи данных у карт microSD и miniSD выше, чем у TF.

Карта памяти для смартфона

Где используются карты памяти TF?

Карты памяти TF применяются в небольших электронных гаджетах: MP3-плеерах, смартфонах, ноутбуках, игровых консолях, электронных книгах, цифровых фотоаппаратах и видеорегистраторах. С помощью карт стандарта TransFlash можно увеличить стандартный объем памяти устройства. Также они применяются в качестве носителя для хранения персональных файлов: фотографий, документов, видеороликов и т.д.

Карта памяти для смартфона Загрузка…

TF card — что это? Рассказываем

TF card — что это? TF-карты, или карты T-Flash, являются миниатюрными картами памяти Secure Digital, известными как TransFlash. Карты TF впервые были представлены в 2004 году SanDisk как самая маленькая карта памяти в мире, модернизированная NAND MLC для управления технологией.

TF-карты были специально разработаны для мобильных телефонов и небольших электронных гаджетов. Как и все карты памяти, они имеют разную скорость работы и различные объема хранилища данных.

tf card что это

TF-card — что это такое? Описание

TransFlash была анонсирована Ассоциацией SD Card в качестве третьей карты памяти форм-фактора в семействе Secure Digital после карты памяти SD и miniSD. После принятия стандарта TransFlash корпорация изменила имя продуктового решения на microSD. Объем TF card — что это? MicroSD имеет те же размеры и спецификации, что и TransFlash, и поэтому обе карты памяти полностью совместимы друг с другом.

Карты TransFlash (TF) и microSD почти одинаковы и обычно могут использоваться взаимозаменяемо, за исключением того, что у microSD есть поддержка режима SDIO, а TF данной возможности не имеет. SDIO позволяет картам microSD выполнять задания без памяти, такие как Bluetooth, GPS и Near Field Communication (NFC).

Размер карты TF

Емкость TF card — что это? Физический размер устройства составляет 15 мм x 11 мм x 1 мм. TF-карта поставляется в различных емкостях хранения данных, таких как 128 МБ, 256 МБ, 512 МБ, 1 ГБ, 2 ГБ, 4 ГБ, 6 ГБ, 8 ГБ, 16 ГБ, 32 ГБ и 64 ГБ.

tf card slot что это

В чем разница между картой TF и ​​картой Micro SD?

TF-карта или TransFlash внешне похожа на Micro SD-карты, но отличается технологически. Основное различие состоит в следующем:

  • Скорости передачи (скорости чтения и записи).

  • Доступность размера памяти. Максимальная емкость карты TF — 128 ГБ, SD-карты — 2 ТБ.

  • Карты SD имеют больше транзисторов.

  • В SD-карте есть переключатель на сегменте безопасности, тогда как TransFlash не имеет такой функции.

  • Есть разница в размерах между TF-картой и SD-картой. Карточка TF — 15 mm × 11 mm × 1 mm. SD-карта — 24 mm × 32 mm × 2,1 mm.

Структурная разница

TF card slot — что это? Маленькая карта памяти обычно используется как флэш-накопитель. TF card также можно назвать электронным запоминающим устройством, которое хранит цифровую информацию. Используется в любых портативных электронных гаджетах, таких как ноутбуки, планшеты, компьютеры, MP3-плееры, КПК, игровые приставки, электронные клавиатуры, синтезаторы, мобильные телефоны и цифровые камеры.

tf card что это такое

Применение

Micro SD-карта (2 ГБ), также называемая TF-картой, применяется с дополнительным адаптером для установки непосредственно в слот для карт памяти компьютера. Trans Flash для мобильных телефонов позволяет:

  • расширить память на мобильном телефоне;

  • переносить контент на новое устройство и обмениваться фотографиями/мелодиями/музыкой;

  • быстро и легко переносить файлы с ПК на внешний носитель.

Каждая карта памяти поставляется с адаптером SD, который позволяет использовать его как полноразмерную защищенную цифровую карту в устройствах с поддержкой SD.

Скорость чтения информации

Скорость SD-карты обычно оценивается по ее последовательной скорости чтения или записи. Последовательный аспект производительности наиболее важен для хранения и извлечения больших файлов (относительно размеров блоков, встроенных во флэш-память), таких как изображения и мультимедиа. Небольшие данные (такие как имена файлов, размеры и временные метки) подпадают под гораздо более низкий предел скорости произвольного доступа, что может быть ограничивающим фактором в некоторых случаях использования.

Оперативность TF card — что это? Новые семейства SD-карт, к которым относятся и TF card, улучшают быстродействие карты за счет увеличения скорости передачи. Независимо от скорости шины карта может сигнализировать хосту, что она «занята», пока не будет завершена операция чтения или записи. Соблюдение более высокой скорости — это гарантия того, что карта ограничивает использование индикатора «занято».

что такое tf card

Что такое TF card? Особенности

TF card имеют ряд особенностей. Перечислим основные из них:

  • Защита — карты могут защитить их содержимое от стирания или модификации, предотвратить доступ неавторизованных пользователей и защитить контент, используя управление цифровыми правами.
  • Команды для отключения записи — хост-устройство может заставить TF-карту стать доступной только для чтения, чтобы отклонить последующие команды для записи на нее информации. Для этого есть как обратимые, так и необратимые команды хоста.
  • Открытые и заблокированные карты — пользователь может назначать большинство полноразмерных TF-карт в режиме «только для чтения» с помощью скользящей вкладки, которая покрывает надпись на карте.

Изменение пароля — хост-устройство может заблокировать карту, используя пароль размером до 16 байт, обычно предоставляемый пользователем. Заблокированная карта обычно взаимодействует с главным устройством, за исключением того, что она отклоняет команды для чтения и записи данных. Заблокированную карту можно разблокировать, только предоставив тот же пароль. После предоставления старого пароля хост-устройство может указать новый пароль или отключить блокировку. Без пароля (как правило, в случае если пользователь его забывает) хост-устройство может заставить карту стереть все данные на карте для будущего повторного использования (за исключением данных карты под DRM), но нет способа для получения доступа к существующим данным.

Что такое карта памяти TF?

В эпоху развития компьютерных технологий человек уже не может обойтись без смартфона или планшета. Постоянно возрастает спрос на различные мобильные носители, каждому хочется получить наиболее емкий и скоростной.

Сегодня пойдет речь о картах памяти — самых распространенных аксессуарах для мобильных аппаратов. В каждом гаджете сейчас имеется для них особый слот. Нас интересует TF карта памяти, что это такое и какими параметрами она обладает.

Фото - что такое карта памяти tf

Формат карты памяти и его особенности

Существует много форматов, так как ранее компании, занимавшиеся производством электроники, стремились разработать собственный тип устройств. Сейчас же их пытаются объединить.

Самый старый формат – SD Card, разработанный в конце прошлого века, отличающийся крупными размерами. Позднее он неоднократно дорабатывался и теперь существует три форм-фактора:

  • стандартная SD-карта
  • mini SD
  • micro SD

Что такое TF?

Стандарты постепенно устаревают, хотя ранее они повсеместно использовались в фотоаппаратах. Micro SD были созданы компанией SanDisk в 2004 году, тогда они назывались именно TransFlash. Сокращение TF, которое вы периодически наблюдаете в интернете, пошло именно с тех времен. Такие карты маленького размера, но их вставляют не только в смартфоны с маленькими слотами, но и в более крупную технику посредством специальных адаптеров.

Фото 2 - что такое карта памяти tf

Увеличение размеров

Еще через несколько лет формат претерпел изменения, его модифицировали и увеличили объем, переименовав в SDHC. Еще позже появились SDXC, обладающие самой большой вместительностью.

Существует еще несколько форматов – Smart Media, Microdrive и другие. Они постепенно утрачивают позиции на рынке, чаще всего применяются в специализированных устройствах.

Классы скорости

Еще один немаловажный аспект, от которого зависит качество работы устройства — скорость. Она измеряется в мегабайтах, которые в состоянии принять карта за одну секунду. Когда форматов стало слишком много, ввели специальную классификацию.

Сейчас распространены классы от 2 до 16. Чем выше – тем быстрее работает устройство. Что более важно, каждый гаджет имеет свои требования к скорости работы карты. В случае с мобильными телефонами — приобретение Micro SD медленнее четвертого класса бессмысленно, а для дорогих зеркальных фотоаппаратов нужен как минимум десятый. Требования к этому параметру продолжают расти с каждым годом, а медлительные модели устаревают и уступают место на рынке более технологичным собратьям.

Фото 3 - что такое карта памяти tf

На современную карту влезает огромное количество информации, чего 15 лет назад никто и представить не мог. Теперь вы знаете достаточно о характеристиках таких устройств, чтобы сделать корректный выбор, который подойдет для вашей техники.

Карта памяти — Википедия

Материал из Википедии — свободной энциклопедии

Наглядная миниатюризация карт памяти: их размеры со временем уменьшаются.

Ка́рта па́мяти (иногда неправильно флеш-ка́рта) — компактное электронное запоминающее устройство, используемое для хранения цифровой информации. Современные карты памяти изготавливаются на основе флеш-памяти, хотя принципиально могут использоваться и другие технологии. Карты памяти широко используются в электронных устройствах, включая цифровые фотоаппараты, сотовые телефоны, ноутбуки, портативные цифровые аудиопроигрыватели.

В числе первых коммерческих форматов карт памяти были платы PC Card (карты типа I), изготовлявшиеся по спецификации PCMCIA. Они появились в начале 1990-х годов, но в настоящее время используются в основном в промышленных целях и для подключения устройств ввода-вывода, таких как сетевые карты, модемы и жёсткие диски. В 1990-х годах появились карты памяти меньших форматов, чем PC Card, в том числе CompactFlash, SmartMedia и Miniature Card. Потребность в меньших картах для мобильных телефонов, КПК и компактных цифровых фотоаппаратов создала тенденцию, по которой всякий раз предыдущее поколение «компактных» карт выглядело крупным. В цифровых фотоаппаратах карты SmartMedia и CompactFlash применялись вполне успешно, в 2001 году SM захватили 50 % рынка цифровых камер, а CF полностью господствовали на рынке профессиональных цифровых камер. Однако, к 2005 г. карты SD/MMC почти полностью заняли место карт SmartMedia, хотя и не на том же уровне и в условиях жёсткой конкуренции с картами Memory Stick и CompactFlash. В промышленности, несмотря на почтенный возраст карт памяти PC card (PCMCIA), им до сих пор удаётся сохранять нишу, тогда как в мобильных телефонах и КПК они кое-где применялись до 2010 года, когда в новых телефонах высокого класса стали доминировать карты микро-SD.

С 2010 года новые продукты Sony (ранее использовавшие только карты памяти Memory Stick) и Olympus (ранее использовавшие только карты xD-Card) предлагаются с дополнительным слотом для SD-Card.[1] В войне форматов победителем вышли SD-карты.[2][3]

В конце 2013 года компания «Transcend» анонсировала выпуск карт памяти SDHC нового поколения — со встроенным Wi-Fi-модулем. С помощью специального приложения, «Wi-Fi SD», разработанного компанией для мобильных устройств (смартфоны, планшетные компьютеры) с операционными системами iOS и Android стало возможным осуществлять беспроводную передачу данных на мобильные устройства с фотоаппаратов, диктофонов, видеорегистраторов и т. д.

Таблица некоторых форматов карт памяти[править | править код]

НазваниеАкронимФормфакторТСЗАП
PC CardPCMCIA85,6 × 54 × 3,3 ммНет
CompactFlash ICF-I43 × 36 × 3,3 ммНет
CompactFlash IICF-II43 × 36 × 5,5 ммНет
SmartMediaSM / SMC45 × 37 × 0,76 ммНет
Memory StickMS50,0 × 21,5 × 2,8 ммMagicGate
Memory Stick Duo
MSD
31,0 × 20,0 × 1,6 ммMagicGate
Memory Stick PRO DuoMSPD31,0 × 20,0 × 1,6 ммMagicGate
Memory Stick PRO-HG DuoMSPDX31,0 × 20,0 × 1,6 ммMagicGate
Memory Stick Micro M2M215,0 × 12,5 × 1,2 ммMagicGate
Miniature Card37 × 45 × 3,5 ммНет
Multimedia CardMMC32 × 24 × 1,5 ммНет
Reduced Size Multimedia CardRS-MMC16 × 24 × 1,5 ммНет
MMCmicro CardMMCmicro12 × 14 × 1,1 ммНет
Secure Digital cardSD32 × 24 × 2,1 ммCPRM
SxSSxSнеизвестно
Universal Flash StorageUFS15 × 11 × 0,74 мм[4]неизвестно
miniSD cardminiSD21,5 × 20 × 1,4 ммCPRM
microSD card (TransFlash)microSD, TF15 × 11 × 0,7 ммCPRM
xD-Picture CardxD20 × 25 × 1,7 ммНет
Intelligent StickiStick24 × 18 × 2,8 ммНет
Serial Flash ModuleSFM45 × 15 ммНет
µ cardµcard32 × 24 × 1 ммнеизвестно
NT CardNT NT+44 × 24 × 2,5 ммНет


SD-карты, оснащённые модулем Wi-Fi. (например SD-карты Eye-Fi Class 6 с Wi-Fi 802.11n.)[5]

  • SD to CF (Secure Digital SD to CF CompactFlash Card Adapter Type II)
  • SDHC to CF
  • Micro SD/TF to CF
  • MS to CF
  • MicroSD (TF) to MS/MS Pro Duo
  • MS to PC card
  • Micro SD to SD
  • USB (типа флешки)
Карта памяти для игровой консоли

Многие игровые консоли используют собственные твердотельные карты памяти для хранения данных. Хотя в домашних игровых консолях игры как правило записываются на лазерные диски или жёсткие диски из-за их большей ёмкости, в большинстве портативных игровых систем разработчики предпочитают встраивать картриджи и карты памяти из-за их низкого энергопотребления, малых физических размеров и механической простоты устройства.

Ёмкости в скобках относятся к официальным картам памяти, выпущенным в первых партиях.

  • Линейка Microsoft Xbox:
    • Xbox Memory Unit (8 Мбайт)
    • Xbox 360 Memory Unit (64 Мбайт/256 Мбайт/512 Мбайт)
  • Линейка Nintendo:
    • Nintendo 64 Controller Pak (256 Кбит/32 Кбайт), поделённых на 123 страницы
    • Nintendo GameCube Memory Card версии: 59 блоков (4 Мбит/512 Кбайт), 251 блок (16 Мбит/2 Мбайт) и 1019 блоков (64 Мбит/8 Мбайт)
    • Wii Nintendo GameCube совместимая с Multimedia Card или совместимая с картой Secure Digital до 2 GB
    • Nintendo DSi совместимая с картой Secure Digital
  • Sega Dreamcast Visual Memory Unit (VMU) (128 Кбайт поделённых на 200 блоков)
  • Карта памяти Sega Saturn может иметь 20 блоков с записями игр.
  • Линейка Sony PlayStation:
    • Карта памяти PlayStation (1 Мбит/128 Кбайт, поделённых на 15 блоков).
    • PlayStation 2 использует карты 8 Мбайт для своего собственного контента и поддерживает карты памяти PlayStation для обратной совместимости. Сторонними производителями выпускаются карты большей ёмкости, но они не поддерживаются официально.
    • Для ранних моделей PlayStation 3 характерна интеграция с CompactFlash, Secure Digital и Memory Stick PRO Duo. Внешние устройства позволяют импортировать и экспортировать сохранения на карты памяти PlayStation и PlayStation 2.
    • Модели PSP-1000, −2000 и −3000 используют для хранения данных Memory Stick PRO Duo, тогда как модель PSP Go использует Memory Stick Micro.
    • PlayStation Vita использует карты памяти собственного формата (от 4 до 32 Гбайт).
  • Портативная игровая консоль GP2X на базе GNU/Linux использует карты SD/MMC.
  • Neo Geo AES, разработанная в 1990 г. фирмой SNK Playmore, была первой игровой консолью, использующей карты памяти. Карты памяти AES совместимы также с Neo-Geo MVS для игровых автоматов.
⛭
Основные статьи
Типы
  • CompactFlash (CF, CFast)
  • CFexpress
  • Express Card
  • JEIDA
  • MultiMedia Card (MMC: RS-MMC, MMCplus, MMCmobile, MMCmicro, eMMC)
  • Memory Stick (MS, MS-PRO, MS-PRO HG, MS-XC)
  • miCard
  • Microdrive (MD)
  • MiniCard
  • P2
  • PCMCIA (PC Card, CardBus, CardBay)
  • Secure Digital (SDSC, SDHC, SDXC, TransFlash, Eye-Fi)
  • SmartMedia (SM)
  • SxS
  • Universal Flash Storage (UFS)
  • USB
  • xD-Picture
  • XQD

TF card — что это? Рассказываем

TF card — что это? TF-карты, или карты T-Flash, являются миниатюрными картами памяти Secure Digital, известными как TransFlash. Карты TF впервые были представлены в 2004 году SanDisk как самая маленькая карта памяти в мире, модернизированная NAND MLC для управления технологией.

TF-карты были специально разработаны для мобильных телефонов и небольших электронных гаджетов. Как и все карты памяти, они имеют разную скорость работы и различные объема хранилища данных.tf card что это

TransFlash была анонсирована Ассоциацией SD Card в качестве третьей карты памяти форм-фактора в семействе Secure Digital после карты памяти SD и miniSD. После принятия стандарта TransFlash корпорация изменила имя продуктового решения на microSD. Объем TF card — что это? MicroSD имеет те же размеры и спецификации, что и TransFlash, и поэтому обе карты памяти полностью совместимы друг с другом.


Размер карты TF

Емкость TF card — что это? Физический размер устройства составляет 15 мм x 11 мм x 1 мм. TF-карта поставляется в различных емкостях хранения данных, таких как 128 МБ, 256 МБ, 512 МБ, 1 ГБ, 2 ГБ, 4 ГБ, 6 ГБ, 8 ГБ, 16 ГБ, 32 ГБ и 64 ГБ.tf card slot что это

В чем разница между картой TF и ​​картой Micro SD?

TF-карта или TransFlash внешне похожа на Micro SD-карты, но отличается технологически. Основное различие состоит в следующем:

  • Скорости передачи (скорости чтения и записи).

  • Доступность размера памяти. Максимальная емкость карты TF — 128 ГБ, SD-карты — 2 ТБ.

  • Карты SD имеют больше транзисторов.

  • В SD-карте есть переключатель на сегменте безопасности, тогда как TransFlash не имеет такой функции.

  • Есть разница в размерах между TF-картой и SD-картой. Карточка TF — 15 mm × 11 mm × 1 mm. SD-карта — 24 mm × 32 mm × 2,1 mm.

Структурная разница

TF card slot — что это? Маленькая карта памяти обычно используется как флэш-накопитель. TF card также можно назвать электронным запоминающим устройством, которое хранит цифровую информацию. Используется в любых портативных электронных гаджетах, таких как ноутбуки, планшеты, компьютеры, MP3-плееры, КПК, игровые приставки, электронные клавиатуры, синтезаторы, мобильные телефоны и цифровые камеры.

tf card что это такое

Применение

Micro SD-карта (2 ГБ), также называемая TF-картой, применяется с дополнительным адаптером для установки непосредственно в слот для карт памяти компьютера. Trans Flash для мобильных телефонов позволяет:

  • расширить память на мобильном телефоне;

  • переносить контент на новое устройство и обмениваться фотографиями/мелодиями/музыкой;

  • быстро и легко переносить файлы с ПК на внешний носитель.

Каждая карта памяти поставляется с адаптером SD, который позволяет использовать его как полноразмерную защищенную цифровую карту в устройствах с поддержкой SD.

Скорость чтения информации

Скорость SD-карты обычно оценивается по ее последовательной скорости чтения или записи. Последовательный аспект производительности наиболее важен для хранения и извлечения больших файлов (относительно размеров блоков, встроенных во флэш-память), таких как изображения и мультимедиа. Небольшие данные (такие как имена файлов, размеры и временные метки) подпадают под гораздо более низкий предел скорости произвольного доступа, что может быть ограничивающим фактором в некоторых случаях использования.

Оперативность TF card — что это? Новые семейства SD-карт, к которым относятся и TF card, улучшают быстродействие карты за счет увеличения скорости передачи. Независимо от скорости шины карта может сигнализировать хосту, что она «занята», пока не будет завершена операция чтения или записи. Соблюдение более высокой скорости — это гарантия того, что карта ограничивает использование индикатора «занято».

Что такое TF card? Особенности

TF card имеют ряд особенностей. Перечислим основные из них:

  • Защита — карты могут защитить их содержимое от стирания или модификации, предотвратить доступ неавторизованных пользователей и защитить контент, используя управление цифровыми правами.
  • Команды для отключения записи — хост-устройство может заставить TF-карту стать доступной только для чтения, чтобы отклонить последующие команды для записи на нее информации. Для этого есть как обратимые, так и необратимые команды хоста.
  • Открытые и заблокированные карты — пользователь может назначать большинство полноразмерных TF-карт в режиме «только для чтения» с помощью скользящей вкладки, которая покрывает надпись на карте.

Изменение пароля — хост-устройство может заблокировать карту, используя пароль размером до 16 байт, обычно предоставляемый пользователем. Заблокированная карта обычно взаимодействует с главным устройством, за исключением того, что она отклоняет команды для чтения и записи данных. Заблокированную карту можно разблокировать, только предоставив тот же пароль. После предоставления старого пароля хост-устройство может указать новый пароль или отключить блокировку. Без пароля (как правило, в случае если пользователь его забывает) хост-устройство может заставить карту стереть все данные на карте для будущего повторного использования (за исключением данных карты под DRM), но нет способа для получения доступа к существующим данным.

TF-IDF — Википедия

Материал из Википедии — свободной энциклопедии

TF-IDF (от англ. TF — term frequency, IDF — inverse document frequency) — статистическая мера, используемая для оценки важности слова в контексте документа, являющегося частью коллекции документов или корпуса. Вес некоторого слова пропорционален частоте употребления этого слова в документе и обратно пропорционален частоте употребления слова во всех документах коллекции.

Мера TF-IDF часто используется в задачах анализа текстов и информационного поиска, например, как один из критериев релевантности документа поисковому запросу, при расчёте меры близости документов при кластеризации.

TF (term frequency — частота слова) — отношение числа вхождений некоторого слова к общему числу слов документа. Таким образом, оценивается важность слова ti{\displaystyle t_{i}} в пределах отдельного документа.

tf(t,d)=nt∑knk{\displaystyle \mathrm {tf} (t,d)={\frac {n_{t}}{\sum _{k}n_{k}}}} ,

где nt{\displaystyle n_{t}} есть число вхождений слова t{\displaystyle t} в документ, а в знаменателе — общее число слов в данном документе.

IDF (inverse document frequency — обратная частота документа) — инверсия частоты, с которой некоторое слово встречается в документах коллекции. Основоположником данной концепции является Карен Спарк Джонс[1]. Учёт IDF уменьшает вес широкоупотребительных слов. Для каждого уникального слова в пределах конкретной коллекции документов существует только одно значение IDF.

idf(t,D)=log⁡|D||{di∈D∣t∈di}|{\displaystyle \mathrm {idf} (t,D)=\log {\frac {|D|}{|\{\,d_{i}\in D\mid t\in d_{i}\,\}|}}} ,[2]

где

  • |D| — число документов в коллекции;
  • |{di∈D∣t∈di}|{\displaystyle |\{\,d_{i}\in D\mid t\in d_{i}\,\}|} — число документов из коллекции D{\displaystyle D}, в которых встречается t{\displaystyle t} (когда nt≠0{\displaystyle n_{t}\neq 0}).

Выбор основания логарифма в формуле не имеет значения, поскольку изменение основания приводит к изменению веса каждого слова на постоянный множитель, что не влияет на соотношение весов.

Таким образом, мера TF-IDF является произведением двух сомножителей:

tf-idf⁡(t,d,D)=tf⁡(t,d)×idf⁡(t,D){\displaystyle \operatorname {tf-idf} (t,d,D)=\operatorname {tf} (t,d)\times \operatorname {idf} (t,D)}

Большой вес в TF-IDF получат слова с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах.

Существуют различные формулы, основанные на методе TF-IDF. Они отличаются коэффициентами, нормировками, использованием логарифмированных шкал. В частности, поисковая система Яндекс долгое время использовала нормировку по самому частотному термину в документе[источник не указан 3302 дня].

Одной из наиболее популярных формул является формула BM25.

Если документ содержит 100 слов, и слово[3] «заяц» встречается в нём 3 раза, то частота слова (TF) для слова «заяц» в документе будет 0,03 (3/100). Вычислим IDF как десятичный логарифм отношения количества всех документов к количеству документов содержащих слово «заяц». Таким образом, если «заяц» содержится в 1000 документах из 10 000 000 документов, то IDF будет равной: log(10 000 000/1000) = 4. Для расчета окончательного значения веса слова необходимо TF умножить на IDF. В данном примере, TF-IDF вес для слова «заяц» в выбранном документе будет равен: 0,03 × 4 = 0,12.

Применение в модели векторного пространства[править | править код]

Мера TF-IDF часто используется для представления документов коллекции в виде числовых векторов, отражающих важность использования каждого слова из некоторого набора слов (количество слов набора определяет размерность вектора) в каждом документе. Подобная модель называется векторной моделью и даёт возможность сравнивать тексты, сравнивая представляющие их вектора в какой-либо метрике (евклидово расстояние, косинусная мера, манхэттенское расстояние, расстояние Чебышёва и др.), то есть производя кластерный анализ.

  1. ↑ Jones, 2004.
  2. ↑ В некоторых вариантах формулы не используется логарифмирование.
  3. ↑ Обычно перед анализом документа слова приводятся морфологическим анализатором к нормальной форме.
  • Jones K. S. A statistical interpretation of term specificity and its application in retrieval (англ.) // Journal of Documentation : журнал. — MCB University: MCB University Press, 2004. — Vol. 60, no. 5. — P. 493-502. — ISSN 0022-0418.
  • Дж Солтон. Динамические библиотечно-поисковые системы. М.: — Мир, 1979.
  • Salton, G. and McGill, M. J. 1983 Introduction to modern information retrieval. McGraw-Hill, ISBN 0-07-054484-0.
  • Salton, G., Fox, E. A. and Wu, H. 1983 Extended Boolean information retrieval. Commun. ACM 26, 1022—1036.
  • Salton, G. and Buckley, C. 1988 Term-weighting approaches in automatic text retrieval. Information Processing & Management 24(5): 513—523
  • Федоровский А.Н, Костин М. Ю. Mail.ru на РОМИП-2005 // в сб. «Труды РОМИП’2005» Труды третьего российского семинара по оценке методов информационного поиска. Под ред. И. С. Некрестьянова, стр. 106—124, Санкт-Петербург: НИИ Химии СПбГУ, 2005.

TF — это… Что такое TF?

TF

Определение

TF(Term Frequency) — частота данного слова в данном документе.

Формула


В числителе стоит количество появлений рассматриваемого слова, в знаменателе — сумма количеств появлений всех слов.

Описание

Эта величина используется для предотвращения увеличения веса более длинных документов, в которых слово может встречаться большее количество раз, несмотря на свою, возможно, небольшую важность в документе. TF показывает истинную важность слова для документа.

Пример

Для примера рассмотрим два текста и покажем полезность частоты слова [[топор]], в сравнении с его количеством появления. Для простоты будем за слово считать только существительные, либо прилагательные образованные от них.

Отрывок из романа Федора Михайловича Достоевского «Преступление и Наказание»:

Иголка и нитки были у него уже давно приготовлены и лежали в столике, в бумажке. Что же касается петли, то это была очень ловкая его собственная выдумка: петля назначалась для топора. Нельзя же было по улице нести топор в руках. А если под пальто спрятать, то все-таки надо было рукой придерживать, что было бы приметно. Теперь же, с петлей, стоит только вложить в нее лезвие топора, и он будет висеть спокойно, подмышкой изнутри, всю дорогу. Запустив же руку в боковой карман пальто, он мог и конец топорной ручки придерживать, чтоб она не болталась; а так как пальто было очень широкое, настоящий мешок, то и не могло быть приметно снаружи, что он что-то рукой, через карман, придерживает.

Отрывок из статьи в Википедии «Боевой топор»:

Древнейшее подобное топору орудие, — «тесло», — появилось около 20 тыс. лет назад и представляло собой широкую дубину, в отверстие которой вклеивался острый камень. То есть, в отсутствие возможности сверления камня, не топорище вставлялось в топор, а топор в топорище.

Вычислим TF(топор) для обоих текстов.

Топор — 4
Рука — 4
Пальто — 3
Петля — 3
Карман — 2
Иголка — 1
Нитка — 1
Стол — 1
Бумажка — 1
Выдумка — 1
Улица — 1
Лезвие — 1
Подмышка — 1
Дорога — 1
Ручка — 1
Мешок — 1
Топор — 3
Камень — 2
Камень — 2
Топорище — 2
Орудие — 1
Тесло — 1
Дубина — 1
Отверстие — 1
Возможность — 1
Сверление — 1
Отсутствие — 1

В отрывке из романа «Преступление и Наказание» слово топор присутствует 4 раза, в то время как в отрывке из статьи в Википедии всего 3. При использовании количества появлений в качестве меры, вес романа будет больше веса статьи. Поэтому требуется нормирование количества появлений, то есть частота появлений. TF статьи больше TF романа, поэтому если пользователю необходимо найти информацию боевом топоре, то поисковая система использующая TF сработает лучше.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *