Стандартизации тестов — это воспроизводимость. Тест для оценки прыгучести футболистов. Функциональные пробы футболистов.

Следующий критерий стандартизации тестов — это воспроизводимость (иногда в научной литературе это свойство теста называют надежностью или достоверностью). Согласно требованиям этого критерия, тест обладает высокой вопроизводимостью, если при повторном тестировании одного и того же спортсмена в стандартных условиях удается регистрировать одинаковые (или близкие к ним) результаты. Как и валидность, воспроизводимость может быть оценена количественно с помощью расчета коэффициента воспроизводимости. При этом в первом столбце записываются результаты первой попытки, во втором — второй. В последующих двух столбцах таблицы определяется место, занятое испытуемым в первой попытке (х) и во второй (у). В пятом столбце показана разность между местами, занятыми в первой и второй попытках. В качестве примера приведем определение воспроизводимости в тесте, оценивающем прыгучесть футболистов (прыжок в высоту с места, отталкиваясь двумя ногами). Ход расчета представлен в таблице расчета коэффициента воспроизводимости.

Таблица расчета коэффициента воспроизводимости

Таблица расчета коэффициента воспроизводимости оценивающем прыгучесть футболистов
коэффициент воспроизводимости

где r— коэффициент воспроизводимости,

n — число испытуемых, ε — сумма, d—разность попыток у каждого испытуемого.

Полученный коэффициент, равный 0,77, указывает на сравнительно высокую воспроизводимость этого теста. Если в таких расчетах коэффициент оказывается равным 0,9 и выше, то воспроизводимость теста считается очень высокой, при 0,6 и ниже —очень низкой. Воспроизводимость теста может быть искусственно повышена за счет увеличения числа попыток. Если при двукратном тестировании (подряд) какого-либо скоростного качества (например, времени реакции) коэффициент воспроизводимости обычно колеблется в пределах 0,2—0,4 (очень низкая величина), то увеличение числа попыток до 9—15 приводит к увеличению значения коэффициента, а значит, и воспроизводимости до 0,7—0,9. К сожалению, при обследовании спортсменов такой путь не всегда применим, так как он приводит к резкому увеличению затрат времени, средств и искажению данных вследствие утомления тестируемых.

Любой тест должен проверяться и на объективность, которая предполагает однозначность результатов по данному тесту при измерении его у одних и тех же спортсменов разными тренерами. Иными словами, на результатах тестирования не должны сказываться личные качества исследователя.

Определение объективности производится несколькими способами. Первый — это сравнение результатов, полученных разными экспериментаторами при тестировании одних и тех же спортсменов. При этом сопоставляют средние арифметические и их стандартные отклонения. Если различия по этим оценкам находятся в пределах установленных ошибок измерений, то тест признается объективным.

Объективность теста может быть установлена и путем расчета различных коэффициентов.

Особенно важно соблюдение этого критерия стандартизации в современной практике наблюдений за технико-тактическим мастерством футболистов. Известно, что в процессе таких наблюдений исследователь должен регистрировать все приемы, которые футболисты выполняют во время игры (короткие, средние и длинные передачи, ведения, перехваты, удары, игра головой и т. п.).

Уже не раз наблюдались случаи, когда два наблюдателя представляли материалы, в которых расхождение достигало нескольких десяткою процентов. Соблюсти принцип объективности можно при условии создания единой схемы наблюдения по типу той, что первоначально была создана Ю. А. Морозовым.

Существуют и другие критерии стандартизации, в частности эквивалентность, разделительность и т. п., которые сами по себе достаточно важны, но их практическое определение возможно и необходимо при условии, что вначале оценены валидность, воспроизводимость и объективность.

Применение любого теста или их комплекса должно обязательно основываться на строгом учете этих критериев. Если, например, тест не проходил проверку на валидность,— тестирование превращается в пустую формальность, ибо при этом можно оценивать все что угодно, кроме того качества футболиста, которое нужно было измерить. Спортивная практика дает тому много подтверждений. Одним из широко распространенных силовых тестов является измерение силы кисти. Между тем, уже давно было найдено, что коэффициенты корреляции между результатами в силовых упражнениях, включающих функционирование наиболее крупных мышечных групп, и показателями силы кисти очень малы. Это означает, что данный тест измеряет только силу кисти и по нему нельзя судить о том, каковы силовые возможности остальных мышечных групп *.

* Отметим, что этот тест много лет с успехом применял Н. Г. Озолин для оценки состояния сильнейших спортсменов. Но результаты, показанные учениками Н. Г. Озолина в этом тесте, расценивались им главным образом как показатели основных свойств ц. н. с. — Прим. авт.

До недавнего времени достаточно популярными были и функциональные пробы (трехминутный бег, двадцать приседаний и т. п.), считавшиеся универсальными для оценки уровня подготовленности футболистов. И только расчеты по измерению корреляционных связей между спортивными результатами в соревновательном упражнении и результатами в этих пробах, продемонстрировали их низкую валидность.

И, наконец, еще об одном «универсальном» тесте для измерения скоростных, способностей — беге на 100 м. Недавние исследования, проведенные на детях 7—16 лет и на спринтерах II и III спортивных разрядов, показали, что результат в беге на 100 м для этих контингентов людей отражает уровень развития специальной выносливости. А скоростные возможности футболистов, равно как и спортсменов в других игровых видах спорта, необходимо измерять в упражнениях гораздо меньшей длины (бег на 15 м с ходу, бег на 15 м со старта и т. п.).

Критерий воспроизводимости теста особенно важен в так называемых сравнительных экспериментах. Каждый тренер оценивает качество своей работы по разнице между предварительным и итоговым тестированием учеников. Если при этом использовать тесты, обладающие низкой воспроизводимостью, то выявить действительную разницу между начальным и конечным результатами в данном упражнении невозможно.

Одна из причин низкой воспроизводимости — это несовершенство методики измерения результатов теста. Для примера рассмотрим такие скоростные тесты, как бег на 15—40 м. Если измерять результаты в этих тестах с помощью фотоэлектронных пли любых других автоматических измерительных систем, то их воспроизводимость будет высокой. Но массового распространения эти устройства не получили, и повсюду фиксация времени производится с помощью обычного пружинного секундомера. И тогда на «истинное» время ученика накладываются «добавки» — ошибки секундомера и личные ошибки секундометриста, в некоторых случаях доходящие до 0,3—0,5 сек. Если «истинные» оценки времени изменяются по вполне определенному закону, то ошибочные составляющие каждого измерения — по случайному. Это искажает величину коэффициента воспроизводимости.

Все оказанное относительно плохо воспроизводимых тестов вовсе не означает, что они должны быть изъяты из арсенала контрольных упражнений педагога. Нужно выяснить причину низкой воспроизводимости и попытаться устранить ее, изменив методику выполнения теста или способ измерения и т. п.

Причина низкой объективности теста кроется прежде всего в том, что не унифицированы методики тестирования и измерений. В принципе каждый тест должен проводиться разными педагогами одинаково. Обычно этого не бывает, и тогда всевозможные «накладки» и ошибки разных тренеров не дают возможность сравнивать результаты тестирования и объективно оценивать деятельность каждого педагога.

После того как тесты прошли проверку в соответствии с критериями стандартизации, встает другой не менее важный вопрос: сколько нужно тестов для того, чтобы охарактеризовать состояние спортсмена или какой-либо системы организма? Конечно, всегда надо стремиться к тому, чтобы использовать максимум тестов. Однако в этом случае перед педагогом встают трудности и организационного и теоретического характера. Предположим, что наиболее полно оценить силовые качества футболиста можно с помощью 20 тестов. В число этих тестов входит измерение максимальной силы и ее градиентов практически во всех крупных мышечных группах. Чтобы провести один тест, нужно приобрести и настроить аппаратуру, укрепить и проверить датчики, создать спортсмену условия для проявления максимума силы в определенном движении и т. п. И все это повторяется 20 раз. Уходит много времени, необходимо и большое количество подчас сложной и дорогостоящей аппаратуры. Кроме того, если измерения проводятся слишком долго, то спортсмен устает, и надежность тестов, которые измеряются в конце тестирования, резко падает. Избежать всего этого вполне возможно, если учитывать следующее обстоятельство. Тесты обладают разной информативностью, например, если 20 тестами оценивать уровень развития силовых качеств, то это вовсе не означает, что каждый тест вносит в суммарную оценку 5% вклада. Методами многомерного статистического анализа можно установить, что одни тесты дают вклад 15—20%, другие 1—2%. Это означает, что из 20 тестов нужно отбирать только те, которые обладают высокой информативностью. Кроме того, все тесты находятся в определенной взаимосвязи, причем некоторые из них очень тесно коррелируют друг с другом, образуя группы по нескольку тестов в каждой. Из таких групп надо выбрать 1—2 теста, ибо они дадут ту же самую информацию, что и остальные. Подобный подход позволяет уменьшить число тестов с 20 до 5—7. При этом потеря информации может быть незначительной: если 20 тестов дают 100% информации о интересующем нас качестве, то 5—7 могут дать 60—80%.

Еще одно замечание о методике тестирования. Предлагая спортсмену выполнить какой-либо тест, мы пытаемся оценить максимальный уровень развития двигательных качеств. Выполнение такого теста требует от спортсмена проявления и волевых качеств, причем на самом высоком уровне. Таким образом, при использовании так называемых «максимальных тестов» оцениваются:

1. Уровень развития двигательного качества.

2. Волевые качества.

Может получиться так, особенно при тестировании выносливости, что спортсмен с высоким уровнем развития этого качества покажет в тесте меньший результат, чем спортсмен с более низким уровнем выносливости, но обладающий сильной волей. Поэтому нужно подбирать так называемые субмаксимальные тесты, в которых не требуется предельного проявления волевых качеств. В виде примера можно сослаться на тест, отражающий уровень развития выносливости,— максимальное потребление кислорода. Спортсмен способен потребить максимум кислорода только во время длительной работы максимальной интенсивности, при которой ЧСС поддерживается на уровне 180—190 ударов в минуту. Работать так очень трудно, и необходимо проявлять значительные волевые усилия, чтобы поддержать заданный темп. Можно значительно облегчить тестирование, если основываться на следующем факте. Ученые установили, что при увеличении ЧСС со 140 до 180—190 ударов линейно увеличивается потребление кислорода. Зная потребление кислорода в работе с ЧСС 140—150 ударов, несложно рассчитать, каким оно будет при работе с ЧСС 180 ударов. Работать (даже длительно) с ЧСС 140 ударов сравнительно легко, и поэтому тестирование в этом случае проходит безболезненно для спортсмена.

Измерения должны проводиться в стандартных условиях, т. е. в одном и том же месте, в одинаковое время. Перед измерениями спортсмен должен провести разминку. Его нужно ознакомить с содержанием теста. Перед основным тестированием выполняются 2—3 пробные попытки (если тест трудоемкий, то такие попытки могут не проводиться).

Важным моментом тестирования является измерение результатов в тесте. От того, как точно это сделано, зависит конечная оценка измеряемой функции. В спортивно-педагогической практике каждое измерение включает в себя по меньшей мере три величины. Первая — это так называемая истинная оценка измеряемого объекта. Она отражает его действительное состояние, но зарегистрировать нам ее никогда не удается. Это происходит потому, что истинную оценку искажают две другие составляющие измерения. Одна из них связана с вариативностью измеряемой функции. Человеку даже при самом точном измерении никогда не удается в каком-либо тесте показать одинаковый результат подряд несколько раз. Причина этого — нестандартность работы нервной, мышечной и других систем, т. е. так называемая биологическая вариативность. Другая составляющая обязана своим происхождением ошибкам измерения. Они сопутствуют любому измерению и появляются вследствие неправильной работы регистрирующего прибора, его неверной установки, личных ошибок исследователя и др. Если значение таких ошибок велико, то судить об измеряемой функции по показаниям прибора весьма рискованно. Вместе с тем необходимо отметить, что подобные ошибки можно устранить, отрегулировав прибор, наладив методику измерений и т. д.

Сколько раз нужно измерять качество (или любую другую характеристику) спортсмена, которое подлежит оценке? Число таких измерений зависит от биологической вариативности измеряемой функции и обычно не бывает меньше двух. Так, например, силовые качества измеряются два раза, и в окончательный результат идет средняя оценка. А вот время реакции — показатель, который очень сильно варьирует. Его нужно измерить 7— 11 раз и по этим, измерениям выводить среднюю оценку.

Перейти вверх к навигации

Перепечатка материалов с данного сайта запрещена.

return_links(); ?>