Телефония WIKI

Телефония (/тя /tə-LEF–-ни-ни) – это область технологий, включающая разработку, применение и развертывание “телекоммуникационных” услуг с целью электронной передачи голоса, факса или данных между удаленными сторонами. История телефонии тесно связана с изобретением и развитием телефона.

Телефонией обычно называют конструкцию или эксплуатацию телефонов и телефонных систем, а также систему телекоммуникаций, в которой телефонное оборудование используется для передачи речи или другого звука между точками, с использованием проводов или без них.^[1] Термин также часто используется для обозначения компьютерного оборудования, программного обеспечения и компьютерных сетевых систем, которые выполняют функции, традиционно выполняемые телефонным оборудованием. В данном контексте технология конкретно упоминается как интернет-телефония, или передача голоса по интернет-протоколу (VoIP).

Обзор[редактировать]

Первые телефоны были соединены непосредственно парами. У каждого пользователя был отдельный телефон, подключенный к каждому местоположению, с которым можно было связаться. Это быстро стало неудобным и неуправляемым, когда пользователи хотели общаться более чем с несколькими людьми. Изобретение телефонной станции предоставило решение для установления телефонных соединений с любым другим телефоном, находящимся в эксплуатации в местном регионе. Каждый телефон был подключен к станции сначала одним проводом, позже одной парой проводов, местным контуром. Близлежащие станции в других зонах обслуживания были соединены магистральными линиями, и междугородняя связь могла быть установлена путем ретрансляции вызовов через несколько станций.

Первоначально коммутаторы exchange управлялись вручную обслуживающим персоналом, обычно называемым “оператор коммутатора“. Когда клиент поворачивал ручку на телефоне, это активировало индикатор на панели перед оператором, который в ответ подключал гарнитуру оператора к этому разъему и предлагал услугу. Вызывающий абонент должен был запросить вызываемую сторону по имени, позже по номеру, и оператор подключал один конец цепи к разъему вызываемой стороны, чтобы предупредить их. Если вызываемая станция отвечала, оператор отсоединял гарнитуру и завершал передачу от станции к станции. Междугородние звонки осуществлялись с помощью других операторов в других обменных пунктах сети.

До 1970-х годов большинство телефонов были постоянно подключены к телефонной линии, установленной в помещениях клиентов. Позже переход к установке разъемов, которые заканчивали внутреннюю проводку, позволил просто заменять телефонные аппараты телефонными штекерами и позволил переносить гарнитуру в несколько мест в помещениях, где были установлены разъемы. Внутренняя проводка ко всем гнездам была подсоединена в одном месте к проводному переходу, который соединяет здание с кабелем. Кабели обычно подводят большое количество отводных проводов со всей районной сети доступа к одному проводному центру или телефонной станции. Когда пользователь телефона хочет сделать телефонный звонок, оборудование на станции проверяет набранный телефонный номер и соединяет эту телефонную линию с другой в том же проводном центре или с магистралью, соединяющей удаленную станцию. Большинство станций в мире связаны между собой через систему более крупных систем коммутации, образующих телефонную сеть общего пользования с коммутацией (ТСОП).

Во второй половине 20-го века факс и передача данных стали важными второстепенными приложениями сети, созданной для передачи голосов, а в конце века части сети были модернизированы с помощью ISDN и DSL для улучшения обработки такого трафика.

Сегодня телефония использует цифровую технологию (цифровую телефонию) при предоставлении телефонных услуг и систем. Телефонные звонки могут предоставляться в цифровом виде, но могут быть ограничены случаями, когда “последняя миля” является цифровой, или когда преобразование между цифровыми и аналоговыми сигналами происходит внутри телефона. Это усовершенствование позволило снизить затраты на связь и улучшить качество голосовых услуг. Первая реализация этого, ISDN, позволяла быстро передавать все данные из конца в конец по телефонным линиям.^[2] Позже эта услуга стала гораздо менее важной из-за возможности предоставления цифровых услуг на основе пакета интернет-протоколов.^[3]

С появлением технологии персональных компьютеров в 1980-х годах, computer telephony integration (CTI) постепенно предоставляла более сложные телефонные услуги, инициируемые и контролируемые компьютером, такие как выполнение и прием голосовых, факсимильных вызовов и передачи данных с помощью служб телефонного справочника и идентификации вызывающего абонента. Интеграция программного обеспечения для телефонии и компьютерных систем является важным достижением в эволюции автоматизации делопроизводства. Термин используется при описании компьютеризированных служб центров обработки вызовов, таких как те, которые направляют ваш телефонный звонок в нужный отдел компании, в которую вы звоните. Также иногда используется для возможности использования вашего персонального компьютера для инициирования телефонных звонков и управления ими (в этом случае вы можете рассматривать свой компьютер как свой личный центр обработки вызовов).^[4]

Цифровая телефония[редактировать]

Цифровая телефония – это использование цифровой электроники при эксплуатации и предоставлении телефонных систем и услуг. С конца 20 века цифровая базовая сеть заменила традиционные системы аналоговой передачи и сигнализации, и большая часть сети доступа также была оцифрована.

Начиная с разработки транзисторной технологии, зародившейся в Bell Telephone Laboratories в 1947 году, до схем усиления и коммутации в 1950-х годах, коммутируемая телефонная сеть общего пользования (ТСОП) постепенно перешла к твердотельной электронике и автоматизации. Вслед за развитием компьютерных электронных коммутационных систем, включающих технологии металл-оксид–полупроводник (MOS) и импульсно–кодовой модуляции (PCM), ТСОП постепенно эволюционировала в направлении оцифровки сигналов и аудиопередач. С тех пор цифровая телефония значительно улучшила пропускную способность, качество и стоимость сети. Оцифровка позволяет передавать широкополосную голосовую связь по одному каналу с улучшенным качеством более широкого аналогового голосового канала.

История[редактировать]

Самые ранние сквозные аналоговые телефонные сети, которые были модифицированы и модернизированы до сетей передачи с системами несущей цифрового сигнала 1 (DS1 / T1), относятся к началу 1960-х годов. Они были разработаны для поддержки базового голосового канала с частотой 3 кГц путем дискретизации аналогового голосового сигнала с ограниченной полосой пропускания и кодирования с использованием импульсно-кодовой модуляции (PCM). Ранние фильтры с кодеком PCM были реализованы в виде пассивных цепей фильтрации резистор–конденсатор–катушка индуктивности, с аналого–цифровым преобразованием (для оцифровки голосов) и цифро-аналоговым преобразованием (для восстановления голосов), выполняемым дискретными устройствами. Ранняя цифровая телефония была непрактична из-за низкой производительности и высокой стоимости ранних фильтров кодеков PCM.^[5]^[6]

Практическая цифровая телекоммуникация стала возможной благодаря изобретению полевого транзистора металл–оксид–полупроводник (MOSFET)^[7], что привело к быстрому развитию и широкому внедрению цифровой телефонии PCM.^[6] МОП–транзистор был изобретен Мохаммедом М. Аталлой и Давоном Кангом в Bell Telephone Laboratories в 1959 году, и вскоре после этого была предложена интегральная схема металл–оксид-полупроводник (MOS), но технология MOS изначально была проигнорирована Bell, поскольку они не сочли ее практичной для аналоговых телефонных приложений, прежде чем она была коммерциализирована Fairchild и RCA для цифровой электроники, такой как компьютеры.^[8]^[6] Технология MOS в конечном итоге стала практичной для телефонных приложений с интегральной схемой MOS со смешанным сигналом, которая объединяет аналоговую и цифровую обработку сигналов на одном чипе, разработанном бывшим инженером Bell Дэвидом А. Ходжесом совместно с Полом Р. Греем в Калифорнийском университете в Беркли в начале 1970-х годов.^[6] В 1974 году Ходжес и Грей работали с Р.Э. Суаресом над схемотехникой MOS с переключаемым конденсатором (SC), которую они использовали для разработки чипа цифроаналогового преобразователя (DAC), используя МОП-конденсаторы и МОП-транзисторы для преобразования данных.^[6] Микросхемы MOS с аналого-цифровым преобразователем (АЦП) и DAC были коммерциализированы к 1974 году.^[9]

Схемы MOS SC привели к разработке чипов PCM с кодек-фильтром в конце 1970-х годов.^[6]^[5] Чип PCM-кодек-фильтра с кремниевым затвором CMOS (комплементарная MOS), разработанный Ходжесом и У.К. Блэком в 1980 году,^[6] с тех пор стал промышленным стандартом для цифровой телефонии.^[6]^[5] К 1990-м годам телекоммуникационные сети, такие как коммутируемая телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью очень крупномасштабной интеграции (VLSI) CMOS PCM-кодек-фильтров, широко используемых в электронных системах коммутации для телефонных станций, частных филиалов (PBX) и ключевых телефонных систем (KTS); пользовательских модемов; приложений для передачи данных, таких как цифровые контурные операторы, мультиплексоры , удлинители телефонных контуров, терминалы цифровой сети интегрированных услуг (ISDN), цифровые беспроводные телефоны и цифровые сотовые телефоны; и такие приложения, как оборудование для распознавания речи, голосовое хранилище данных, голосовая почта и цифровые бесконтактные автоответчики.^[5] Пропускная способность цифровых телекоммуникационных сетей быстро увеличивается экспоненциально, что подтверждается законом Эдгольма,^[10] в значительной степени обусловленным быстрым масштабированием и миниатюризацией технологии MOS.^[11]^[6]

Несжатый цифровой звук в формате PCM с 8-битной глубиной и частотой дискретизации кГц требует скорости передачи данных 64 кбит /с, что было непрактично для ранних цифровых телекоммуникационных сетей с ограниченной пропускной способностью. Решением этой проблемы стало линейное прогнозирующее кодирование (LPC), алгоритм кодирования речи сжатиемданных, который был впервые предложен Фумитадой Итакурой из Университета Нагои и Сюзо Сайто из Nippon Telegraph and Telephone (NTT) в 1966 году. LPC был способен к сжатию аудиоданных до 2,4 кбит /с, что привело к первым успешным переговорам в режиме реального времени по цифровым сетям в 1970-х годах.^[12] LPC с тех пор является наиболее широко используемым методом кодирования речи.^[13] Другой метод сжатия аудиоданных, алгоритм дискретного косинусного преобразования (DCT), называемый модифицированным дискретным косинусным преобразованием (MDCT), широко применяется для кодирования речи в приложениях передачи голоса по IP (VoIP) с конца 1990-х годов.^[14]

Развитие методов передачи, таких как SONET и оптоволоконная передача, привело к дальнейшему усовершенствованию цифровой передачи. Хотя существовали аналоговые несущие системы, которые мультиплексировали множество аналоговых голосовых каналов на одну среду передачи, цифровая передача позволяла снизить стоимость и мультиплексировать большее количество каналов на среде передачи. Сегодня конечный прибор часто остается аналоговым, но аналоговые сигналы обычно преобразуются в цифровые сигналы в интерфейсе зоны обслуживания (SAI), центральном офисе (CO) или другом пункте агрегирования. Операторы цифрового контура (DLC) и оптоволокно к x еще больше приближают цифровую сеть к помещениям клиентов, низводя аналоговый локальный контур до статуса устаревшего.

IP-телефония[редактировать]

Коммерческий IP-телефон с клавиатурой, клавишами управления и функциями экрана для выполнения настройки и пользовательских функций.

Область технологий, доступных для телефонии, расширилась с появлением новых коммуникационных технологий. Телефония в настоящее время включает в себя технологии интернет-сервисов и мобильной связи, включая видеоконференции.

Новые технологии, основанные на концепциях интернет-протокола (IP), часто упоминаются отдельно как телефония с передачей голоса по IP (VoIP), также обычно называемая IP-телефонией или интернет-телефонией. В отличие от традиционных телефонных услуг, услуги IP-телефонии относительно не регулируются правительством. В Соединенных Штатах Федеральная комиссия по связи (FCC) регулирует соединения между телефонами, но заявляет, что они не планируют регулировать соединения между пользователем телефона и поставщиком услуг IP-телефонии.^{[требуется цитирование]}

Специализация цифровой телефонии, телефония по интернет-протоколу (IP), предполагает применение цифровой сетевой технологии, которая была основой для Интернета, для создания, передачи и приема сеансов телекоммуникаций по компьютерным сетям. Интернет-телефония широко известна как протокол передачи голоса по Интернету (VoIP), отражающий принцип, но на него ссылаются со многими другими терминами. VoIP зарекомендовала себя как прорывная технология, которая быстро заменяет традиционные технологии телефонной инфраструктуры. По состоянию на январь 2005 года до 10% телефонных абонентов в Японии и Южной Корее перешли на эту цифровую телефонную связь. В статье в Newsweek за январь 2005 года высказывалось предположение, что интернет-телефония может стать “следующей большой вещью”.^[15] По состоянию на 2006 год многие VoIP-компании предлагают услуги потребителям и предприятиям.^{[требуется обновление]}

IP-телефония использует подключение к Интернету и аппаратные IP-телефоны, аналоговые телефонные адаптеры или компьютерные приложения для программного телефона для передачи разговоров, закодированных в виде пакетов данных. В дополнение к замене обычной телефонной службы (POTS), услуги IP-телефонии конкурируют с услугами мобильной связи, предлагая бесплатные или более дешевые соединения через точки доступа через Wi-Fi. VoIP также используется в частных сетях, которые могут иметь или не иметь подключение к глобальной телефонной сети.

Стационарные телефонные линии на 100 жителей 1997-2007

Исследование социального воздействия[редактировать]

Прямое общение от человека к человеку включает невербальные сигналы, выраженные в мимике и другой артикуляции тела, которые не могут быть переданы при традиционной голосовой телефонии. Видеотелефония в разной степени восстанавливает такие взаимодействия. Теория сигналов социального контекста – это модель для измерения успешности различных типов коммуникации в поддержании невербальных сигналов, присутствующих при взаимодействии лицом к лицу. В исследовании рассматривается множество различных сигналов, таких как физический контекст, различные выражения лица, движения тела, тон голоса, прикосновения и запахи.

При использовании телефона теряются различные коммуникационные сигналы. Общающиеся стороны не способны идентифицировать движения тела, им не хватает осязания и обоняния. Хотя эта сниженная способность распознавать социальные сигналы хорошо известна, Визенфельд, Рагурам и Гаруд указывают, что этот тип связи имеет ценность и эффективность для решения различных задач.^[16]Они исследуют рабочие места, на которых различные виды общения, такие как телефон, более полезны, чем взаимодействие лицом к лицу.

Распространение связи на услуги мобильной телефонной связи создало иной фильтр социальных сигналов, чем стационарный телефон. Использование мгновенных сообщений, таких как текстовые сообщения, на мобильных телефонах создало чувство общности.^[17] В социальной конструкции мобильной телефонии предполагается, что каждый телефонный звонок и текстовое сообщение – это нечто большее, чем попытка поговорить. Вместо этого это жест, который поддерживает социальную связь между семьей и друзьями. Несмотря на потерю определенных социальных сигналов с помощью телефонов, мобильные телефоны приносят новые формы выражения различных сигналов, которые понятны разным аудиториям. Новые языковые дополнения пытаются компенсировать врожденный недостаток нефизического взаимодействия.

Другой социальной теорией, поддерживаемой посредством телефонии, является теория зависимости от СМИ. Эта теория приходит к выводу, что люди используют медиа или ресурс для достижения определенных целей. Эта теория утверждает, что существует связь между средствами массовой информации, аудиторией и большой социальной системой.^[18] Телефоны, в зависимости от конкретного человека, помогают достичь определенных целей, таких как доступ к информации, поддержание контакта с другими, быстрая передача сообщений, развлечения и т.д.

Телефония

Основы IP-телефонии, базовые принципы, термины и протоколы

16 мин

487K

Разработка систем связи*

Recovery mode

Добрый день, уважаемые хабражители. В данной статье я постараюсь рассмотреть основные принципы IP-телефонии, описать наиболее часто используемые протоколы, указать способы кодирования и декодирования голоса, разобрать некоторые характерные проблемы.

Под IP-телефонией подразумевается голосовая связь, которая осуществляется по сетям передачи данных, в частности по IP-сетям (IP — Internet Protocol). На сегодняшний день IP-телефония все больше вытесняет традиционные телефонные сети за счет легкости развертывания, низкой стоимости звонка, простоты конфигурирования, высокого качества связи и сравнительной безопасности соединения. В данном изложении будем придерживаться принципов эталонной модели OSI (Open Systems Interconnection basic reference model) и рассказывать о предмете “снизу-вверх”, начиная с физического и канального уровней и заканчивая уровнями данных.

”
Модель OSI и инкапсуляция данных

Принципы IP-телефонии

При осуществлении звонка голосовой сигнал преобразуется в сжатый пакет данных (подробнее этот процесс будет рассмотрен в главах “Импульсно кодовая модуляция” и “Кодеки”). Далее происходит пересылка данных пакетов поверх сетей с коммутацией пакетов, в частности, IP сетей. При достижении пакетами получателя, они декодируются в оригинальные голосовые сигналы. Эти процессы возможны благодаря большому количеству вспомогательных протоколов, часть из которых будет рассмотрена далее.

В данном контексте, протокол передачи данных — некий язык, позволяющий двум абонентам понять друг друга и обеспечить качественную пересылку данных между двумя пунктами.

Отличие от традиционной телефонии

В традиционной телефонии установка соединения происходит при помощи телефонной станции и преследует исключительно цель разговора. Здесь голосовые сигналы передаются по телефонным линиям, через выделенное подключение. В случае же IP-телефонии, сжатые пакеты данных поступают в глобальную или локальную сеть с определенным адресом и передаются на основе данного адреса. При этом используется уже IP-адресация, со всеми присущими ей особенностями (такими как маршрутизация).

При этом IP-телефония оказывается более дешевым решением как для оператора, так и для абонента. Происходит это благодаря тому, что:

Традиционные телефонные сети обладают избыточной производительностью, в то время, как IP-телефония использует технологию сжатия голосовых пакетов и позволяет полностью использовать емкость телефонной линии.
Как правило, на сегодняшний момент доступ в глобальную сеть есть у всех желающих, что позволяет сократить затраты на подключение или совсем исключить их.
Звонки в локальной сети могут использовать внутренний сервер и происходить без участия внешней АТС.

Вместе с вышеперечисленным, IP-телефония позволяет улучшить качество связи. Достигается это, опять же, благодаря трем основным факторам:

Телефонные серверы постоянно совершенствуются и алгоритмы их работы становятся более устойчивыми к задержкам или другим проблемам IP-сетей.
В частных сетях их владельцы обладают полным контролем над ситуацией и могут изменять такие параметры, как ширина полосы пропускания, количество абонентов на одной линии, и, как следствие, величину задержки.
Сети с коммутацией пакетов развиваются, и ежегодно вводятся новые протоколы и технологии, позволяющие улучшить качество связи (например, протокол резервирования полосы пропускания RSVP).

Благодаря IP-телефонии очень элегантно решается проблема занятой линии, так как переадресация, либо перевод в режим ожидания могут быть осуществлены несколькими командами в конфигурационном файле на АТС.

Физический уровень (Physical Layer)

На физическом уровне осуществляется передача потока битов по физической среде через соответствующий интерфейс. IP-телефония практически полностью опирается на уже существующую инфраструктуру сетей. В качестве среды передачи информации используются, как правило витая пара категории 5 (UTP5), одномодовое или многомодовое оптическое волокно, либо коаксиальный кабель. Тем самым в полной мере реализуется принцип конвергенции телекоммуникационных сетей.

PoE

Интересно рассмотреть технологию PoE (Power Over Ethernet) — стандарты IEEE 802.3 af-2003 и IEEE 802.3at-2009. Ее суть заключается в возможности обеспечения питанием устройств посредством стандартной витой пары. Большинство современных IP-телефонов, в частности, модельный ряд Cisco Unified IP Phones 7900 Series, поставляются с поддержкой PoE. Согласно стандарту 2009 года, устройства могут получать ток мощностью до 25,5 Ватт.

При подаче питания используются лишь две витых пары кабеля 100BASE-TX, однако некоторые производители задействуют все четыре, достигая мощности до 51 Ватт. Необходимо заметить, что технология не требует модификации уже существующих кабельных систем, в том числе и кабелей Cat 5.

Для определения того, является ли подключаемое устройство питаемым (PD — powered device) на кабель подается напряжение 2,8 — 10 В. Тем самым вычисляется сопротивление подключаемого устройства. Если данное сопротивление находится в диапазоне 19 — 26,5 кОм, то процесс переходит на следующий этап. Если же нет — проверка повторяется с интервалом ≥2 мс.

Далее происходит поиск диапазона мощностей питаемого устройства путем подачи более высокого напряжения и измерения тока в линии. Вслед за этим на линию подается 48 В — питающее напряжение. Также осуществляется постоянный контроль перегрузок.

Канальный уровень (Data Link Layer)

Согласно спецификации IEEE 802 канальный уровень разделяется на два подуровня:

MAC (Media Access Control) — обеспечивает взаимодействие с физическим уровнем;
LLC (Logical Link Control) — обслуживает сетевой уровень.

На канальном уровне работают коммутаторы — устройства, обеспечивающие соединение нескольких узлов компьютерной сети и распределение фреймов между хостами на основе физической (MAC) адресации.

Необходимо упомянуть механизм виртуальных локальных сетей (Virtual Local Area Network). Данная технология позволяет создавать логическую топологию сети без оглядки на ее физические свойства. Достигается это тегированием трафика, что подробно описано в стандарте IEEE 802.1Q.

Формат фрейма

В контексте IP-телефонии отметим Voice VLAN, широко применяющуюся для изоляции голосового трафика, генерируемого IP-телефонами, от других данных. Ее использование целесообразно по двум причинам:

Безопасность. Создание отдельной голосовой VLAN уменьшает вероятность перехвата и анализа голосовых пакетов.
Повышение качества передачи. Механизм VLAN позволяет задать повышенный приоритет голосовым пакетам, и, как следствие, улучшить качество связи.

Сетевой уровень (Network Layer)

На сетевом уровне происходит маршрутизация, соответственно основными устройствами сетевого уровня являются маршрутизаторы (Router). Именно здесь определяется, каким путем данные достигнут получателя с определенным IP-адресом.

Основной маршрутизируемый протокол — IP (Internet Protocol), на основе которого и построена IP-телефония, а также всемирная сеть Интернет. Также существует множество динамических протоколов маршрутизации, самый популярный среди которых OSPF (Open Shortest Path First) — внутренний протокол, основанный на текущем состоянии каналов связи;

На сегодняшний момент существуют специальные VoIP-шлюзы (Voice Over IP Gateway), обеспечивающие подключение обычных аналоговых телефонов к IP-сети. Как правило, они имеют и встроенный маршрутизатор, позволяющий вести учет трафика, авторизовать пользователей, автоматически раздавать IP-адреса, управлять полосой пропускания.

Среди стандартных функций VoIP-шлюзов:

Функции безопасности (создание списков доступа, авторизация);
Поддержка факсимильной связи;
Поддержка голосовой почты;
Поддержка протоколов H.323, SIP (Session Initiation Protocol).

Для борьбы с возможными задержками передачи IP необходимо дополнять дополнительными средствами, например протоколами установления очередности (чтобы голосовые данные не конкурировали с обычными).
Как правило, в этих целях на маршрутизаторах используется очередность с малой задержкой (LLQ — Low-Latency queuing), либо взвешенная организация очередей на основе классов (CBWFQ — Class-Based Weighted Fair Queuing).
Кроме того, необходимы схемы маркировки с заданием приоритетов для рассмотрения голосовых данных, как наиболее важных для передачи.

Транспортный уровень (Transport Layer)

Для транспортного уровня характерны:

Сегментация данных приложений верхнего уровня;
Обеспечение сквозного соединения;
Гарантия надежности данных.

Основные протоколы транспортного уровня — TCP (Transmission Control Protocol), UDP (User Datagram Protocol), RTP (Real-time Transport Protocol). Непосредственно в IP-телефонии используются протоколы UDP и RTP, причем основное их отличие от TCP заключается в том, что они не обеспечивают надежность доставки данных. Это является более приемлемым вариантом, нежели осуществление контроля за доставкой (TCP), так как телефонная связь чрезвычайно зависима от задержек передачи, но менее чувствительна к потерям пакетов.

UDP

UDP базируется на сетевом протоколе IP и предоставляет транспортные услуги прикладным процессам. Его главное отличие от TCP — обеспечение негарантированной доставки, то есть при отправке и получении данных никаких подтверждений не запрашивается. Также при отправке информации не обязательно установление логического соединения между модулями UDP (источник и приемник).

RTP

Несмотря на то, что RTP принято считать протоколом транспортного уровня, как правило он работает поверх UDP. С помощью RTP реализуется распознавание типа трафика, работа с метками времени, контроль передачи и нумерация последовательности пакетов.

Основное назначение RTP состоит в том, что он присваивает каждому исходящему пакету временные метки, обрабатывающиеся на приемной стороне. Это позволяет принимать данные в надлежащем порядке, снижает влияние неравномерности времени прохождения пакетов по сети, восстанавливает синхронизацию между аудио и видео данными.

Уровни данных (Data Layers)

Три последних уровня модели OSI рассмотрим совместно. Такое объединение допустимо, так как процессы, происходящие на данных уровнях тесно связаны между собой, и описывать их безотносительно разделения на подуровни будет логичнее.

H.323

Первым делом необходимо описать стек протоколов H.323, разработанный в 1996 году. Данный стандарт содержит описание оборудования, сетевых служб и терминальных устройств, предназначенных для осуществления аудио- и видеосвязи в сетях с коммутацией пакетов (Интернет). Для любого устройства стандарта H.323 обязательна поддержка обмена голосовой информацией.

Рекомендации H.323 предполагают:

Платформенную независимость.
Стандарты кодирования аналоговых данных.
Управление полосой пропускания.
Гибкость и совместимость.

Отметим очень важный факт: в рекомендациях не определены физическая среда передачи, транспортный протокол и сетевой интерфейс. Это значит, что устройства, поддерживающие стандарт H.323 могут работать в любых существующих сегодня сетях с коммутацией пакетов.

Согласно H.323 четырьмя основными компонентами VoIP-соединения являются:

терминал;
шлюз;
контроллер зоны;
контроллер управления многоточечной конференции (MCU — Multipoint Control Unit).

Пример структурной схемы сети в IP-телефонии

Выдержка из документа, описывающего стек протоколов H.323

Сценарий установки соединения на основе протокола H.323

SIP (Session Initiation Protocol)

SIP — протокол сигнализации, предназначенный для организации, изменения и завершения сеансов связи. SIP независим от транспортных технологий, однако при установлении соединения предпочтительно использовать UDP. Для передачи самой голосовой и видеоинформации рекомендовано применять RTP, но возможность использования других протоколов не исключена.

В SIP определены два типа сигнальных сообщений — запрос и ответ. Также существует шесть процедур:

INVITE (приглашение) — приглашает пользователя принять участие в сеансе связи (служит для установления нового соединения; может содержать параметры для согласования);
BYE (разъединение) — завершает соединение между двумя пользователями;
OPTIONS (опции) — используется для передачи информации о поддерживаемых характеристиках (эта передача может осуществляться напрямую между двумя агентами пользователей или через сервер SIP);
АСК (подтверждение) — используется для подтверждения получения сообщения или для положительного ответа на команду INVITE ;
CANCEL (отмена) — прекращает поиск пользователя;
REGISTER (регистрация) — передает информацию о местоположении пользователя на сервер SIP, который может транслировать ее на сервер адресов (Location Server).

Сценарий сеанса связи SIP

Кодеки

Аудиокодеком называют программу или алгоритм, который сжимает, либо разжимает цифровые звуковые данные, позволяя снизить требования к пропускной способности канала передачи данных. В IP-телефонии на сегодняшний день наиболее распространено преобразование посредством кодека G.729, а также сжатие G.711 по А-закону (alaw) и μ-закону (ulaw).

G.729

G.729 является кодеком, который сжимает исходный сигнал с потерей данных. Основная идея, заложенная в G.729 — передача не самого оцифрованного сигнала, а его параметров (спектральной характеристики, количества переходов через ноль), достаточных для последующего синтезирования на принимающей стороне. При этом все основные характеристики голоса, такие как амплитуда и тембр сохраняются.

Пропускная способность канала, на которую рассчитан данный кодек — 8 кбит/с. Длина кадра обрабатываемого G.729 — 10 мс, частота дискретизации — 8 кГц. Для каждого из таких кадров определяются параметры математической модели, которые в дальнейшем и передаются в канал в виде кодов.

При использовании кодирования G.729 задержка составляет 15 мс, из которых 5 мс тратится на заполнение предварительного буфера. Отметим также, что кодек G.729 предъявляет достаточно высокие требования к ресурсам процессора.

G.711

G.711 — голосовой кодек, который не предполагает никакого сжатия, помимо компандирования — метода уменьшения эффектов каналов с ограниченным динамическим диапазоном. В основе данного метода лежит принцип уменьшения количества уровней квантования сигнала в области высокой громкости, сохраняя при этом качество звука. Две широко использующиеся в телефонии схемы компандирования — alaw и ulaw.

Сигнал в данном кодеке предоставлен потоком величиной 64 кбит/с. Частота дискретизации — 8000 кадров по 8 бит в секунду. Качество голоса субъективно лучше, нежели при применении кодека G.729.

alaw

alaw или А-закон — алгоритм сжатия звуковых данных с потерей информации. В основном используется на территории Европы и России.

Для сигнала x преобразование по алгоритму alaw выглядит следующим образом:

Где А — параметр сжатия (обычно принимается равным 87,7).

ulaw

ulaw или μ-закон — алгоритм сжатия звуковых данных с потерей информации. В основном используется на территории Японии и Северной Америки.

Для сигнала x преобразование по алгоритму ulaw выглядит следующим образом:

где μ принимается равным 255 (8 бит) в стандартах Северной Америки и Японии.

Импульсно кодовая модуляция (PCM — Pulse Code Modulation)

Импульсно кодовая модуляция — передача непрерывной функции в виде серии последовательных импульсов.

Для получения на входе канала связи модулированного сигнала, мгновенное значение несущего сигнала измеряется АЦП с определенным периодом. При этом количество оцифрованных значений в секунду (иначе, частота дискретизации) должно быть большим или равным двукратной максимальной частоте в спектре аналогового сигнала.

Далее полученные значения округляются до одного из заранее принятых уровней. Заметим, что количество уровней необходимо принимать кратным степени двойки. В зависимости от того, сколько было определено уровней, сигнал кодируется определенным количеством бит.

Квантование сигнала

На данном рисунке представлено кодирование с помощью четырех битов (то есть все промежуточные значения аналогового сигнала будут округляться до одного из заранее заданных 16 уровней). Для примера, при времени равном нулю сигнал будет представлен подобным образом: 0111.

При демодуляции последовательность нулей и единиц преобразуется в импульсы демодулятором, уровень квантования которого равен уровню квантования модулятора. После этого ЦАП на основе данных импульсов восстанавливает сигнал, а сглаживающий фильтр окончательно убирает неточности.

В современной телефонии число уровней квантования должно быть большим или равным 100, то есть минимальное количество бит, которым может кодироваться сигнал — 7.

Вопросы качества обслуживания в IP-телефонии (Quality of Service — QoS)

В сетях на основе стека TCP/IP высокое качество обслуживания трафика, чувствительного к задержкам передачи не обеспечивается по умолчанию. При использовании протокола TCP имеется гарантия достоверной доставки информации, но ее перенос может осуществляться с непредсказуемыми задержками. Для UDP характерна минимизация задержек, но гарантия верной доставки пакета отсутствует.

В то же время добротность речевого трафика сильно зависит от качества передачи, и в сети, где не реализованы механизмы, гарантирующие соответственное качество, реализация IP-телефонии может быть не удовлетворяющей требованиям пользователей.

Основными показателями качества обслуживания являются пропускная способность сети и задержка передачи. Задержка при этом определяется как промежуток времени, прошедший с момента отправки пакета, до момента его приема.

Также существуют такие характеристики, как готовность сети и ее надежность (оцениваются по результатам контроля уровня обслуживания в течение длительного времени, либо по коэффициенту использования).

Для улучшения качества связи используются следующие механизмы:

Перемаршрутизация. При перегрузке одного из каналов связи позволяет осуществить доставку при помощи резервных маршрутов.
Резервирование ресурсов канала связи на время соединения.
Приоретизация трафика. Дает возможность помечать пакеты в соответствии с уровнем их важности и производить обслуживание на основе меток.

Как было сказано ранее, голосовой трафик чрезвычайно чувствителен к задержкам передачи. Максимальное время задержки не должно превышать 400 мс (сюда включается и продолжительность обработки информации на конечных станциях). Различают два основных типа задержек:

— Задержка при кодировании информации в голосовых шлюзах или терминальном оборудовании. Уменьшается путем улучшения алгоритмов обработки и преобразования голоса.
— Задержка, вносимая сетью передачи. Уменьшается путем улучшения сетевой инфраструктуры, в частности, сокращением количества маршрутизаторов и использованием высокоскоростных каналов.

Источники задержки в IP-телефонии

Джиттер

Еще одно явление, характерное для IP-телефонии — джиттер, или, иначе, случайная задержка распространения пакета.

Обуславливается джиттер тремя факторами:

Ограниченная полоса пропускания или некорректная работа активных сетевых устройств;
Высокая задержка распространения сигнала;
Тепловой шум.

Наиболее часто применяющийся метод борьбы с джиттером — джиттер-буфер, хранящий определенное количество пакетов.

Обычно предусматривается динамическая подстройка длины буфера в течение всего времени существования соединения. Для выбора наилучшей длины используются эвристические алгоритмы.

Джиттер буфер

Для компенсации неравномерной скорости поступления пакетов на приемной стороне создают временное хранилище пакетов, или так называемый джиттер буфер. Его задача, собрать поступающие пакеты в правильном порядке в соответствии с временными метками и выдать их кодеку с правильными интервалами и правильном порядке.

Джиттер буфер

Размер буфера приемное VOIP устройство рассчитывает в процессе работы, либо принудительно задается в настройках. С одной стороны он не может быть слишком большим, чтобы не увеличивать транспортную задержку. С другой стороны, маленький размер буфера вызывает потери пакетов при изменениях времени задержки в IP сети.

Отсюда и происходит одно из главных противоречий, между интернет провайдерами и пользователями IP телефонии. С точки зрения провайдера все пакеты доставлены абоненту, то есть, потерь нет. А с точки зрения VoIP устройства, разница во времени между приходом пакетов значительно превышает джиттер буфер. Поэтому фактически потери есть. На практике потеря более 1% вызывает определенные неприятные ощущения. При 2% разговор оказывается затруднен. При значениях больше 4% разговор уже практически невозможен.

Размер джиттер буфера

Случайная задержка распространения Ji для i-го пакета может определяться по формуле:

где:
Di – отклонение от ожидаемого времени прибытия i-го пакета.
Отклонение от ожидаемого времени прибытия i-го пакета Di определяется по формуле:

где:
R – время прибытия пакета в метках времени RTP,
S – временная метка RTP, взятая из пакета.

Приведем пример расчета ожидаемого размера случайной задержки распространения 5-го пакета, на основе двух предыдущих.

Пусть J4=10 мс; R4=10, R3=11, S4=6, S3=5, тогда D5 будет равно (10-11)-(6-5)=-2.

В среднем, случайная задержка времени распространения для одного пакета в текущем примере составит 10 мс (точнее можно посчитать по формуле, приведенной выше). Тогда для того, чтобы ни один пакет не был отброшен, размер джиттер буфера должен быть равным 10 мс.

Для определения требуемого размера джиттер буфера в мегабайтах, домножим полученное значение на 100 мбит/сек – среднюю пропускную способность сети: 10•10^-3•100 = 128 кб.

Размер джиттер-буфера должен быть больше, чем флуктуация транзитного времени в сети. Например, если для 10 пакетов время транзита колеблется от 5 до 10 мс, то буфер должен быть хотя бы 8 мс, чтобы ни один пакет не был потерян. Лучше, если буфер еще больше, например 12 мс, тогда сможет работать механизм перезапроса потерянных пакетов.

Решения для развертывания телефонной сети

Asterisk

Asterisk — программная АТС, способная коммутировать как VoIP вызовы, так и вызовы, осуществляемые между IP-телефонами и традиционной телефонной сетью общего пользования.

Поддерживаемые протоколы: IAX, SIP, H.323, Skinny, UNIStim.
Поддерживаемые кодеки: G.711 (ulaw и alaw), G.722, G.723, G.729, GSM, iLBC, LPC-10, Speex.

Asterisk — динамично развивающееся открытое программное обеспечение, которое может быть установлено без оглядки на лицензирование. Это делает данную программную АТС привлекательной для малого и среднего бизнеса. Количество абонентов в сети может достигать 2000 и ограничено только мощностью сервера.

Еще одно достоинство Asterisk — возможность гибкой настройки. Весь необходимый функционал либо уже реализован, либо может быть дописан самостоятельно без существенных временных и денежных затрат. Этому способствует принцип: одна задача — один программный модуль.

В сравнении с решениями от таких вендоров, как Cisco или Avaya, Asterisk привлекателен еще и стоимостью развертывания. Фактически все затраты сводятся только к покупке телефонных аппаратов и сервера, способного обеспечить требуемую нагрузку на сеть. Сама программа абсолютно бесплатна.

Cisco Unified Communication Manager (CallManager)

CallManager предназначен скорее для крупных сетей, включающих до 30000 абонентов. Данный программно-аппаратный комплекс обеспечивает надежность работы и позволяет конфигурировать множество параметров, таких как переадресация звонков или голосовое меню. Существует и “облегченная” express версия, предназначенная скорее для небольших офисов.

Из преимуществ Cisco CallManager следует отметить в первую очередь знаменитую техническую поддержку корпорации Cisco. При соответствующем уровне контракта на обслуживание, любая проблема, начиная с вопросов по настройке и заканчивая вышедшим из строя оборудованием, будет решена практически мгновенно. Поэтому Cisco CallManager подойдет компаниям, готовым платить немалые деньги, но и получать при этом высочайшее качество обслуживания.