В таблице сопряженности что представляют строки и столбцы

Анализ таблиц сопряженностей в ходе статистического анализа социологической информации

Вы будете перенаправлены на Автор24

Таблицы сопряженностей

Таблица сопряженностей, или таблица факторов в статистике — это способ представления совместного распределения каких-то двух переменных для исследования взаимосвязи между этими переменными.

Вообще, таблица сопряженностей считается наиболее универсальным и удобным инструментом изучения определенных статистических отношений, так как такая таблица способна представлять переменные абсолютно в любом уровне измерения.

Стоит отметить, что таблицы сопряженностей довольно часто используются в процессе проверки гипотезы о наличии некой связи между двумя конкретными признаками с применением критерия Фишера или критерия Пирсона.

Анализ таблиц сопряженностей

В структуре таблицы всегда есть подлежащее и сказуемое. Подлежащим является сам объект (список его структурных единиц или имеющихся групп), характеризующийся конкретными числовыми показателями. Подлежащее всегда располагается в строках самой таблицы. Обычно он находится в левой части таблицы.

Сказуемое всегда представляется в виде неких числовых показателей, характеризующих объект и находящихся в столбцах таблицы.

Все таблицы сопряженностей разделяют на:

Все одномерные таблицы обычно строятся на основе группировки имеющихся сведений по одному конкретному признаку. Так, например, на вопрос «С какой попытки Вы поступили в институт?» примерно 500 студентов ответили определенным образом, который и отражается в такой таблице.

Таблицу можно анализировать с помощью подсчета процентов от общего числа респондентов, ответивших на этот вопрос. Они представлены в последнем столбце таблицы. Сформулированный нами вопрос называется альтернативным, в нем отвечающий может выбрать только один вариант ответа, подходящий ему.

Готовые работы на аналогичную тему

Одномерная таблица, прежде всего, позволяет анализировать структуру населения. В нашем случае это позволяет увидеть и сравнить результаты ответов на наш вопрос.

Рисунок 1. Пример одномерной таблицы сопряженностей. Автор24 — интернет-биржа студенческих работ

Двумерные таблицы направлены на расширение аналитических способностей самого исследователя. Синонимами двумерных таблиц являются такие названия, как таблица сопряжения, таблица корреляции, таблица двумерного распределения, таблица комбинированных статистических данных.

Двумерные таблицы построены на основе группировки данных по двум признакам. Анализируя информацию, можно рассчитать процент как «вертикальных», так и «горизонтальных» признаков, а также общее количество респондентов.

Рисунок 2. Пример двумерной таблицы сопряженностей. Автор24 — интернет-биржа студенческих работ

Выбор метода представления сведений в виде процентного значения напрямую зависит от поставленных целей и задач осуществляемого исследования и определяется с помощью общей логики анализа полученных данных.

Именно на месте пересечения строки и столбца таблицы указывается частота появления соответствующих значений двух каких-то признаков. Сумма частот в ряду называется предельной частотой ряда; сумма частот на столбец является предельной частотой столбца. Сумма предельных частот равна размеру выборки; их распределение является одномерным распределением какой-то переменной, которая формирует строки или столбцы этой таблицы. Так, в таблице непредвиденных обстоятельств можно увидеть и абсолютную, и, что очень важно, относительную частоту, выраженную в дробях или процентах.

Относительную частоту всегда можно рассчитать по отношению к:

Таблицы сопряжения используются не только для проверки гипотезы о взаимосвязи между двумя определенными признаками (статистическая взаимосвязь, критерий хи-квадрат), но и для того, чтобы измерить близость имеющейся взаимосвязи.

Таблицы сопряженности считаются главным способом отражения всех доступных социологических сведений. Такие таблицы применяются (рассчитываются и анализируются) практически в каждом эмпирическом исследовании. А ведь это не случайно. Различные средства, используемые при изучении статистических закономерностей (а именно, закономерности исследования и попытки найти социолога, которые основываются на изучении таблиц сопряженностей, предлагаются современной наукой. Такие закономерности обычно основаны на правилах математической статистики.

Стоит отметить, что объектом исследования таких закономерностей являются случайные величины, а предметом исследования — параметры распределения.

Абсолютно все закономерности, которые возможно найти, используя математическую статистику, фактически представляются в виде наборов определенных параметров распределений определенных случайных величин.

Итак, опора на анализ таблиц сопряженностей, к которому призывает социолога здравый смысл, на самом деле оправдывается серьезным исследованием концепции статистической закономерности, которое проводилось в течение нескольких веков в сфере математической статистики.

Значимость анализа таблиц сопряженности давно признана учеными. В настоящее время существует огромное количество методов соответствующего плана. Но не все они активно вовлечены в нашу социологию (парадоксальным является тот факт, что среди мало и редко используемых в большой отечественной практике методов существуют довольно интересные алгоритмы, которые сформированы советскими и российскими исследователями).

Источник

В таблице сопряженности что представляют строки и столбцы

Войти

Авторизуясь в LiveJournal с помощью стороннего сервиса вы принимаете условия Пользовательского соглашения LiveJournal

9. Двумерный анализ: ТС.

Представляется естественным использовать для оценки связей между признаками т. н. частотные таблицы, или таблицы сопряженности (по существу мы о них уже говорили – это выборочные оценки вероятностных распределений многомерных случайных величин; так, в таблице 3 части I приведен пример распределения для двумерной величины). Заметим, что последний термин обязан своим происхождением именно тому обстоятельству, что на основе анализа подобных таблиц можно судить о сопряженности (совместной встречаемости) каких-то значений одних признаков с некоторыми значениями других признаков. Как мы увидим, связь между номинальными признаками, собственно говоря, и выражается в виде подобных сопряженностей.

Общий вид таблицы сопряженности

Обычно ее представляют в несколько ином виде, с явно обозначенными наименованиями признаков и их значений и выписанными маргинальными суммами:

Общий вид таблицы сопряженности

В последние годы в литературе все более используется расширительное понимание таблицы сопряженности. Предполагается, что в качестве ее элементов могут фигурировать не только частоты, но и многие другие числа: скажем, в клетках половозрастной таблицы могут стоять средние значения зарплаты тех людей, которые характеризуются отвечающим клетке значениям пола и возраста. Таким же образом в клетки таблицы могут быть помещены средние другого рода (мода, медиана), дисперсии, величины отклонений от средних по строке (столбцу), разница между эмпирической и теоретической частотой (см. п.2.2.1) и т.д. (см., например, [Ростовцев и др., 1997. С.177-179]). О том же расширительном понимании таблицы сопряженности говорится в описании известного пакета SPSS.

Ниже, приводя примеры, под объектами, число которых подсчитывается при построении таблицы сопряженности, мы будем иметь в виду респондентов. Хотелось бы, чтобы читатель давал себе отчет в условности таких примеров, понимая, что отнюдь не только респонденты могут интересовать социолога.

Информация о выборке сравнивается с теоретической ситуацией, в которой имеет место абсолютная независимость характеристик. Статистика может быть рассчитана по таблице, данные которой приблизительно подчиняются распределению хи-квадрат при нулевой гипотезе независимости.

Характер отношений между двумя переменными можно представить наглядно разными способами. В случае измерения переменных в номинальной или порядковой шкале возможные комбинации значений обеих переменных упорядочиваются в форме таблицы сопряженности, т. е. значения одной переменной образуют строки, а значения друг­ой — столбцы таблицы.

Для количественных данных, а также порядковых переменных с очень большим числом возможных вариантов исходные значения предварительно группируются, т. е. соседние значения объединяются в относительно небольшое число интервалов, так как каждая комбинация значений соответствует новой клетке в таблице.

С помощью таблицы можно установить наличие связи между двумя переменными или ее отсутствие, т. е. их независимость.

В полученной таблице сопряженности в ячейках, стоящих на пересечении соответствующих строк и столбцов, вы увидите частоту появления возможных комбинаций обеих переменных. Например:

Источник

ТАБЛИЦА СОПРЯЖЕННОСТИ

В Т.С. могут быть представлены как абсолютные, так и относительные частоты (в долях или процентах). Относительные частоты могут рассчитываться по отношению: а) к маргинальной частоте по строке; б) к маргинальной частоте по столбцу; в) к объему выборки.

Т.С. используются для проверки гипотезы о наличии связи между двумя признаками ( Статистическая связь, Критерий «хи-квадрат»), а также для измерения тесноты связи ( Коэффициент фи, Коэффициент контингенции, Коэффициент Крамера).

Смотреть что такое «ТАБЛИЦА СОПРЯЖЕННОСТИ» в других словарях:

ТАБЛИЦА СОПРЯЖЕННОСТИ — таблица, содержащая частоты совместного появления значения двух признаков (обозначим их как X и У), измеренных в данной совокупности единиц анализа (в качестве синонимов для обозначения таких таблиц используются такие названия, как комбинационная … Российская социологическая энциклопедия

ТАБЛИЦА СОПРЯЖЕННОСТИ — англ. table, correlation; нем. Ahnlichkeitstabelle. Форма представления данных об объектах социологического исследования на основе группировки двух или более признаков по принципу их сочетаемости. Т. с. применяются для определения процентного… … Энциклопедия социологии

таблица сопряженности — Таблица (ТС), каждая клетка которой соответствует элементу кросс табуляции. В случае двух факторов клетки ТС располагают так, чтобы клетки одной строки соответствовали одному и тому же значению одного фактора, а клетки одного столбца – одному и… … Словарь социологической статистики

Таблица сопряженности — средство представления совместного распределения двух признаков, таблица, строки которой предназначены для значений одной переменной, столбцы для значений другой переменной, на пересечении строки и столбца указывается частота совместного… … Социологический словарь Socium

ТАБЛИЦА СОПРЯЖЕННОСТИ — англ. table, correlation; нем. Ahnlichkeitstabelle. Форма представления данных об объектах социологического исследования на основе группировки двух или более признаков по принципу их сочетаемости. Т. с. применяются для определения процентного… … Толковый словарь по социологии

Таблица сопряженности признаков — * табліца спалучанасці прыкмет * contingency square or contingency table таблица абсолютных частот (количества) наблюдений, столбцы которой соответствуют значениям одного признака, а строки значениям другого признака (в случае двумерной таблицы… … Генетика. Энциклопедический словарь

таблица сопряженности признаков — — [http://www.iks media.ru/glossary/index.html?glossid=2400324] Тематики электросвязь, основные понятия EN contingency table … Справочник технического переводчика

таблица сопряженности двух признаков — 2.22. таблица сопряженности двух признаков Таблица, используемая для представления распределения двух признаков, в строках и столбцах которой указывают, соответственно, значения или классы первого и второго признаков, при этом на пересечении… … Словарь-справочник терминов нормативно-технической документации

ТАБЛИЦА СОПРЯЖЕННОСТИ МНОГОМЕРНАЯ (ТАБЛИЦА МНОГОМЕРНОГО РАСПРЕДЕЛЕНИЯ, КОМБИНАЦИОННАЯ или ПЕРЕКРЕСТНАЯ ТАБЛИЦА) — таблица, отражающая совместное выборочн. распределение нескольких (более двух) дискретных характеристик (измеренных по номинальным или порядковым шкалам). Каждой клетке таблицы соответствует сочетание значений составляющих таблицу характеристик.… … Российская социологическая энциклопедия

таблица — 3.1.3.39 таблица: Форма организации материала в тексте издания, при которой систематически представленные группы взаимосвязанных данных располагаются по графам и строкам таким образом, чтобы каждый отдельный показатель входил в состав и графы, и… … Словарь-справочник терминов нормативно-технической документации

Источник

Таблица сопряженности

Сводная таблица является способом создания таблицы сопряженности с использованием программного обеспечения с электронными таблицами.

Содержание

Пример [ править ]

Предположим, есть две переменные: пол (мужской или женский) и праворукость (правша или левша). Далее предположим, что 100 человек были случайным образом выбраны из очень большой популяции в рамках исследования половых различий в руке. Таблица непредвиденных обстоятельств может быть создана для отображения количества людей, которые являются мужчинами-правшами и левшами, женщинами-правшами и левшами. Такая таблица непредвиденных обстоятельств показана ниже.

ПравшаЛевшаОбщийМужской43952женский44448Общий8713100

Стандартное содержание таблицы непредвиденных обстоятельств [ править ]

Меры ассоциации [ править ]

Степень связи между двумя переменными можно оценить с помощью ряда коэффициентов. В следующих подразделах описаны некоторые из них. Для более полного обсуждения их использования см. Основные статьи, ссылки на которые есть под заголовком каждого подраздела.

Соотношение шансов [ править ]

Отношение шансов имеет простое выражение в терминах вероятностей; учитывая совместное распределение вероятностей:

Коэффициент фи [ править ]

V Крамера и коэффициент случайности C [ править ]

Формулы для коэффициентов C и V :

Недостатком C является то, что он не достигает максимального значения 1.0, в частности, максимальное значение, которое он может достичь в таблице 2 × 2, составляет 0,707. Он может достигать значений, близких к 1,0 в таблицах непредвиденных обстоятельств с большим количеством категорий; например, он может достигать максимум 0,870 в таблице 4 × 4. Поэтому его не следует использовать для сравнения ассоциаций в разных таблицах, если они имеют разное количество категорий. [3]

Коэффициент тетрахорической корреляции [ править ]

Тетрахорическая корреляция предполагает, что переменная, лежащая в основе каждой дихотомической меры, имеет нормальное распределение. [5] Коэффициент обеспечивает «удобную меру корреляции [произведение-момент Пирсона], когда градуированные измерения сведены к двум категориям». [6]

Коэффициент тетрахорической корреляции не следует путать с коэффициентом корреляции Пирсона, вычисляемым путем присвоения, скажем, значений 0,0 и 1,0 для представления двух уровней каждой переменной (что математически эквивалентно коэффициенту φ).

Лямбда-коэффициент [ править ]

Асимметричная лямбда измеряет процентное улучшение прогнозирования зависимой переменной. Симметричная лямбда измеряет процентное улучшение, когда прогнозирование выполняется в обоих направлениях.

Коэффициент неопределенности [ править ]

Кроме того, коэффициент неопределенности является условной и асимметричной мерой ассоциации, которая может быть выражена как

Это свойство асимметричности может привести к пониманию, которое не так очевидно при симметричных показателях ассоциации. [7]

Источник

Таблица сопряженности

Сводная таблица является способом создания таблицы сопряженности с использованием программного обеспечения с электронными таблицами.

СОДЕРЖАНИЕ

Пример

Предположим, есть две переменные: пол (мужской или женский) и праворукость (правша или левша). Далее предположим, что 100 человек были случайным образом выбраны из очень большой популяции в рамках исследования половых различий в руке. Таблица непредвиденных обстоятельств может быть создана для отображения количества людей, которые являются мужчинами-правшами и левшами, женщинами-правшами и левшами. Такая таблица непредвиденных обстоятельств показана ниже.

ПравшаЛевшаОбщийМужчина43 год952женский44 год448Общий8713100

Стандартное содержание таблицы непредвиденных обстоятельств

Меры ассоциации

Степень связи между двумя переменными можно оценить с помощью ряда коэффициентов. В следующих подразделах описаны некоторые из них. Для более полного обсуждения их использования см. Основные статьи, ссылки на которые есть под заголовком каждого подраздела.

Соотношение шансов

Отношение шансов имеет простое выражение в терминах вероятностей; учитывая совместное распределение вероятностей:

Коэффициент Phi

V Крамера и коэффициент непредвиденных обстоятельств C

Формулы для коэффициентов C и V следующие:

Недостатком C является то, что он не достигает максимального значения 1.0, в частности, максимальное значение, которое он может достичь в таблице 2 × 2, составляет 0,707. Он может достигать значений, близких к 1,0 в таблицах непредвиденных обстоятельств с большим количеством категорий; например, он может достигать максимум 0,870 в таблице 4 × 4. Поэтому его не следует использовать для сравнения ассоциаций в разных таблицах, если они имеют разное количество категорий. [3]

Коэффициент тетрахорической корреляции

Тетрахорическая корреляция предполагает, что переменная, лежащая в основе каждой дихотомической меры, имеет нормальное распределение. [5] Коэффициент обеспечивает «удобную меру корреляции [произведение-момент Пирсона], когда градуированные измерения сведены к двум категориям». [6]

Коэффициент тетрахорической корреляции не следует путать с коэффициентом корреляции Пирсона, вычисляемым путем присвоения, скажем, значений 0,0 и 1,0 для представления двух уровней каждой переменной (что математически эквивалентно коэффициенту φ).

Лямбда-коэффициент

Асимметричная лямбда измеряет процентное улучшение прогнозирования зависимой переменной. Симметричная лямбда измеряет процентное улучшение, когда прогнозирование выполняется в обоих направлениях.

Коэффициент неопределенности

Кроме того, коэффициент неопределенности является условной и асимметричной мерой ассоциации, которая может быть выражена как

Это свойство асимметричности может привести к пониманию, которое не так очевидно при симметричных показателях ассоциации. [7]

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *