аванесов в с история возникновения тестов

Аванесов в с история возникновения тестов

аванесов в с история возникновения тестов. Смотреть фото аванесов в с история возникновения тестов. Смотреть картинку аванесов в с история возникновения тестов. Картинка про аванесов в с история возникновения тестов. Фото аванесов в с история возникновения тестов

аванесов в с история возникновения тестов. Смотреть фото аванесов в с история возникновения тестов. Смотреть картинку аванесов в с история возникновения тестов. Картинка про аванесов в с история возникновения тестов. Фото аванесов в с история возникновения тестов

СоцЛаб (библиотека и др.) запись закреплена

Аванесов В.С. Тесты в социологическом исследовании / Институт социологических исследований АН СССР. – М.: Изд-во «Наука», 1982. – 200 с.

Работа посвящена проблемам конструирования и использования тестов в эмпирическом социологическом исследовании. Рассматриваются вопросы оценки качества тестовой информации, приводится соответствующий статистический аппарат. Книга предназначена социологам, психологам.

Введение 3
Раздел первый. Тесты: история и современность 13
Глава первая. Краткая история тестов 13
1. Древний период и средние века 13
2. XIX век. Применение тестов и статистических методов для изучения индивидуальных различий 17
3. Тесты в XX веке. Достижения и заблуждения 23
Глава вторая. Социологический тест 36
1. Определение теста 39
2. Тест в системе социологических методов исследования 41
3. Тестирование как стандартная процедура 45
4. Примеры социологических тестов 49
Глава третья. Элементы матричной алгебры для социологов 61
1. Построение матрицы 61
2. Сложение и вычитание матриц. Умножение на скаляр 63
3. Числовые векторы. Транспонирование 64
4. Умножение векторов и матриц 67
5. Статистические расчеты 71
6. Диагональная и обратная матрица 80
7. Корреляционная матрица в ее свойства 82
8. Возведение матрицы в степень 86
Раздел второй. Конструирование социологических тестов и критерии их качества 87
Глава четвертая. Конструирование социологических тестов 87
1. Программа методического исследования по созданию тестов 88
2. План теста 91
3. Высказывания теста 93
4. Инструкции к тексту 99
5. Общие вопросы социологических измерении 101
Глава пятая. Надежность тестов 106
1. Теория надежности 106
2. Практические методы оценки надежности тестов 114
3. Интерпретация коэффициента надежности 129
Глава шестая. Валидность тестов 135
1. Источники идеи валидности 137
2. Эмпирические подходы к валидизации тестов 140
3. Теоретико-эмпирические методы валидизации тестов 143
4. Формальные аспекты валидизации 150
5. Поведенческие аспекты валидности тестов 157
Раздел третий. Прикладные вопросы использования тестов 163
Глава седьмая. Применение тестов в профессиональном отборе 163
1. Постановка проблемы 163
2. Анализ работы 165
3. Средства определения профессиональной пригодности 166
4. Отбор тестов и других показателей 168
Глава восьмая. Социометрический тест 182
1. Сущность метода 182
2. Аксиоматическая система определений 183
3. Методы обработки результатов социометрического теста 186
Заключение 193

Источник

Аванесов в с история возникновения тестов

ВАДИМ СЕРГЕЕВИЧ
доктор педагогических наук, профессор, гл. ред. журнала «Педагогические Измерения». Подписной индекс журнала 84271

аванесов в с история возникновения тестов. Смотреть фото аванесов в с история возникновения тестов. Смотреть картинку аванесов в с история возникновения тестов. Картинка про аванесов в с история возникновения тестов. Фото аванесов в с история возникновения тестов

История возникновения тестового педагогического контроля уходит своими корнями вглубь веков. Возникновение контроля совпадает с началом культуры, в становлении которой решающую роль играли различные формы образования, в том числе и самые примитивные. Уже в самых древних формах существования человеческих общностей была осмыслена важная роль различных заданий, служивших средством диагностики уровня развития интересующих свойств личности.

Второй период развития тестов проходил под знаком усиления научности, постепенного создания теоретического багажа, в котором самое видное и достойное место занимает так называемая классическая теория тестов. Этот период охватывает время с начала ХХ века до конца семидесятых годов, когда протекало становление этой теории.

В соответствии с отмеченной периодизацией весь материал данной главы разделен на три части.

2.1. ПРЕДЫСТОРИЯ ТЕСТОВ.

В литературе есть немало указаний на древнее, казалось бы, происхождение тестов. Так, например, T.L.Kelly в своей монографии утверждает, что первые тесты появились несколько тысяч лет назад в Древнем Китае (291;1). Аналогичный вывод относительно времени и места происхожения тестов сделал и другой автор, P.H.DuBois, который указал на некоторые факты использования тестов около четырех тысяч лет назад (254; 3).

Если под тестом понимать испытание, как вероятно понимают эти авторы, то тогда можно найти более ранние данные. В середине III тысячелетия до н.э. в Древнем Вавилоне проводились испытания выпускников в школах, где готовились писцы. Благодаря обширным по тем временам знаниям профессиональный писец был центральной фигурой месопотамской цивилизации; он умел измерять поля, делить имущество, петь, играть на музыкальных инструментах. Во время испытаний проверяли его умения разбираться в тканях, металлах, растениях, а также знания всех четырех арифметических действий (84; 54).

Сообщается (207), что эту суровую систему испытаний и отбора успешно преодолел в молодые годы знаменитый ученый древности Пифагор. Вернувшись после учебы в Грецию, он основал свою школу, допуск в которую открывал после серии различных испытаний, похожих на те, которые выдержал он сам.

Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого дерева можно выточить Меркурия» (82), и потому придавал значение диагностике, в первую очередь, именно этих способностей, что делалось с помощью трудных математических задач. Поскольку такие задачи часто не решались, Пифагор проверял умение поступающего в его школу выдерживать критику и сохранять хладнокровие. Неудачно решившего задачи вводили в зал, где ученики, по правилам испытаний, должны были давать ему обидные прозвища, поднимая его на смех. Если поведение новичка в этой критической ситуации характеризовалось умением отвечать на выпады, хорошо и достойно держать себя, его принимали в школу (там же).

Как считают, Пифагор обращал также внимание на походку и на смех молодых людей, утверждая, что манера смеяться служит самым хорошим показателем характера человека. Он внимательно относился к рекомендациям родителей и учителей, тщательно вел наблюдение за каждым новичком, особенно после того, как последнего приглашали свободно высказываться и, не стесняясь, смелее оспаривать мнение собеседников (207).

В III тысячелетии до н.э. в Китае существовала должность правительственного чиновника. Соответственно, появились и первые элементы профотбора на эту должность. Отбору способствовала атмосфера торжественности и внимания к молодым людям, осмелившимся держать государственные экзамены на занятие по этой должности. В китайском обществе эти экзамены воспринимались почти как празднество: тему экзамена нередко давал сам император; он же проводил непосредственную проверку знаний на заключительном этапе многоступенчатого конкурсного отбора претендентов (254).

Позже, во времена династии Хань (III в. до н.э.), вокруг этого дела заметный размах приобрели коррупция и такие «мелкие» нарушения, как мошенничество, сокрытие некоторых биографических данных, социального положения, сдача экзамена вместо другого лица и др. (247).

В Афинах обсуждался вопрос о зависимости могущества государства от способностей лиц, им управляющих. В работе Платона «Государство» на вопрос о том, каких правителей нужно выбирать, Сократ отвечает: «Надо отдавать предпочтение самым надежным, мужественным, и по возможности, самым благообразным; кроме того, надо отыскивать людей не только благородных и строгого нрава, но и обладающих также свойствами, подходящими для такого воспитания. У них. должна быть острая восприимчивость к наукам и быстрая сообразительность. Надо искать человека с хорошей памятью, несокрушимо твердого и во всех отношениях трудолюбивого» (159).

Нередко результаты испытания интеллектуальных способностей становились предметом гордости того или иного народа, а иногда служили даже для извлечения доходов. Сообщается, например, что индийский царь Девсарам, желая испытать мудрость иранцев, прислал им шахматы. Предполагалось, что иранцы вряд ли сумеют разгадать суть этой игры, и потому они должны были, по условию, отослать в Индию подать. Однако визирь Важургмихр понял правила игры и, в свою очередь, изобрел игру, называемую сейчас нарды. Эту игру он послал в Индию, и там выяснилось, что разгадать правила игры в нарды индийцы не смогли ( 150 ).

В созданном чжурчжэнями государстве Цзинь результаты экзаменов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены лучшие поступали на государственную службу в качестве практикующих врачей, преподавателей или исследователей. Худшие выпускники получали разрешение заниматься частной практикой. Не выдержавшим экзамен рекомендовалось либо продолжить подготовку, либо менять профессию (66 ).

Различные конкурсы и экзамены устраивались и в средневековом Вьетнамском государстве. Всего за два года, в период с 1370 по 1372 г. удалось провести переаттестацию всех гражданских чиновников и военнослужащих, что позволило организовать проверку государственного аппарата по всей стране. В результате этого Вьетнам вновь стал сильным и жизнеспособным государством. Особое внимание было уделено созданию боеспособного офицерского корпуса ( 54 ). В ХУ в. экзамены были упорядочены. Они проводились по этапам и турам. Лауреаты получали подарки от короля, их имена вносились в «золотой список», который вывешивался у Восточных ворот столицы, об их победах на конкурсе сообщалось в родную общину. Имена наиболее отличившихся высекались на специальных каменных стелах, установленных в Храме Литературы (там же).

Если использование письменных контрольных работ и экзаменов в странах Востока уже в те годы считалось вполне нормальным и естественным делом, то этого нельзя сказать о странах Запада. Там их применение наталкивалось на трудности психологического характера, вызванные заменой привычных устных форм контроля письменными. Например, в Англии сто лет ушло на слом консервативных традиций, препятствовавших применению письменных контрольных работ в учебном процессе, и еще сто лет на то, чтобы последние начали использоваться на приемных и выпускных экзаменах (238).

Спустя еще сто с небольшим лет (в 1884г.) вышла первая книга с тестовыми материалами, содержавшая задания и ответы к ним с оценкой по пятибалльной шкале. В этой книге содержались задания по математике, истории, грамматике, навигации, давались примерные тексты для сочинений вместе с методом количественной оценки сочинений. Это был первый в истории случай использования простейших статистических расчетов в педагогической работе (344).

Быстро распространявшаяся в США такого рода «дотестовая», как можно её назвать, форма контроля знаний имела не только много сторонников, но и противников. Сообщается, например, о школьном инспекторе из Чикаго, запретившем в 1881г. письменный контроль и обязавшем осуществлять перевод учащихся в очередной класс не на основе проверок, а опираясь исключительно на мнения учителей и директоров школ. Широко распространилось мнение, что никто лучше учителя не сможет оценить способности ученика, и потому всякий контроль, экзамены являются издевательством над здравым смыслом (239). Этим было положено начало широкому движению против какого-либо контроля в школе. Пик такого движения в США пришелся на конец XIX века (1880-е годы), после чего вновь стали появляться предпосылки для формирования благожелательного отношения педагогической общественности к различным формам контроля знаний. Как у нас сейчас, в США тех лет считалось, что знания легче проверять по математике, чем по философии, откуда и проистекает сравнительно большее число заданий по математике, появившихся там к концу XIX века.

Потребность в создании общественно-государственной системы контроля знаний была осознана в США в 1885 году; в штате Нью-Йорк начал действовать так называемый экзаменационный совет, который приложил немало усилий для разработки методов объективного контроля (311;8). Начало общегосударственной оценки знаний положило создание в 1900 году комитета по проверке знаний абитуриентов колледжей в США (там же).

Как отмечает Ш.Амонашвили, участник этих дискуссий К.К.Сент-Илер поставил ряд вопросов, касающихся применения отметок (баллов) в школе. Основным из вопросов был: следует или не следует успехи учеников выражать цифрами(. Определенного ответа на него так и не было получено. Ответ был дан позже, в мае 1918 года, постановлением Народного Комиссариата по просвещению, в соответствии с которым все отметки были отменены. Отрицательные последствия этого постановления были осознаны к 1935 году. В связи с резко возросшей потребностью в специалистах, школьные баллы были вновь восстановлены. Таким образом, резюмирует Ш.А.Амонашвили, послереволюционный опыт обучения без отметок не увенчался успехом (36; 101).

Случай с тестами дает классический пример совпадения вещей по видимости и их различий по существу. Различия начинаются с рассмотрения основного понятия. В философии сложилась традиция рассмотрения научных понятий с двух противоположных позиций. Как отмечал Б.М.Кедров, каждое понятие может быть зафиксировано, во-первых, как сложившееся, готовое на данный момент времени, а потому как неизменное, постоянное.

Во-вторых, научные понятия могут и должны быть рассмотрены исходя из того, что они выражают и резюмируют собой на каждом этапе определенную ступень развития науки. В результате складываются две логические схемы: формальнологическая, оперирующая относительно неизменными, готовыми понятиями, и диалектологическая, оперирующая изменчивыми, развивающимися понятиями (110).

Можно думать, что поиск адекватных методов исследования личности явился тем необходимым условием, породившим попытки научно осмыслить качество используемых испытаний. Такие испытания Ф.Гальтон и его последователи назвали тестами, оговорив первые требования, которым они должны соответствовать. Это были критерии надежности и валидности, подробно изученные в классический период становления теории и практики тестового контроля. Краткое содержание того и другого критерия представлено здесь в разделах 5.1 и 5.2.

Источник

К вопросам истории и теории тестов

аванесов в с история возникновения тестов. Смотреть фото аванесов в с история возникновения тестов. Смотреть картинку аванесов в с история возникновения тестов. Картинка про аванесов в с история возникновения тестов. Фото аванесов в с история возникновения тестов

К вопросам истории и теории тестов

Вопросы истории возникновения тестов. Из глубины веков.

Еще в середине III тысячелетия до н. э. в Древнем Вавилоне проводились испытания выпускников в школах, где готовились писцы. Благодаря обширным, по тем временам, знаниям профессиональный писец был центральной фигурой месопотамской цивилизации; он умел измерять поля, делить имущество, петь, играть на музыкальных инструментах. Во время испытаний проверяли его умения разбираться в тканях, металлах, растениях, а также знания всех четырех арифметических действий (Дандамаев писцы. М.: Наука, 19с), и естественно, умение писать.

Пифагор подчеркивал важную роль интеллектуальных способностей, утверждая, что «не из каждого дерева можно выточить Меркурия». И потому придавал значение диагностике, в первую очередь, именно этих способностей, что делалось с помощью трудных математических задач (Голицин этюды Древней Греции. Пифагор // Москвитянин. 1855. №19-20. Кн.1-2.).

Как считают, Пифагор обращал также внимание на походку и на смех молодых людей, утверждая, что манера смеяться служит самым хорошим показателем характера человека. Он внимательно относился к рекомендациям родителей и учителей, тщательно вел наблюдение за каждым новичком, особенно после того, как последнего приглашали свободно высказываться и, не стесняясь, смелее оспаривать мнение собеседников (там же).

В III тысячелетии до н. э. в Китае существовала должность правительственного чиновника. Соответственно, появились и первые элементы профотбора на эту должность. Отбору способствовала атмосфера торжественности и внимания к молодым людям, осмелившимся держать государственные экзамены на занятие по этой должности. В китайском обществе эти экзамены воспринимались почти как празднество. Тему экзамена нередко давал сам император, и он же проводил проверку знаний претендентов и на заключительном этапе конкурса (DuBois P. H. A History of Psychological Testing. Boston, Allyn and Bacon Inc., 19p. cit.).

В Афинах обсуждался вопрос о зависимости могущества государства от способностей лиц, им управляющих. В работе Платона «Государство» на вопрос о том, каких правителей нужно выбирать, Сократ отвечает: «Надо отдавать предпочтение самым надежным, мужественным, и по возможности, самым благообразным; кроме того, надо отыскивать людей не только благородных и строгого нрава, но и обладающих также свойствами, подходящими для такого воспитания. У них. должна быть острая восприимчивость к наукам и быстрая сообразительность. Надо искать человека с хорошей памятью, несокрушимо твердого и во всех отношениях трудолюбивого» (там же).

В созданном чжурчжэнями государстве Цзинь результаты экзаменов применялись для распределения выпускников медицинского училища. Из числа выдержавших экзамены лучшие специалисты поступали на государственную службу в качестве практикующих врачей, преподавателей или исследователей. Худшие выпускники получали разрешение заниматься частной практикой, а лицам, не выдержавшим экзамен, рекомендовалось либо продолжить подготовку, либо менять профессию (Воробьев чжурчженей и государство Цзинь (X вг.). М.: Наука, 19с.).

Если использование письменных контрольных работ и экзаменов в странах Востока уже в те годы считалось вполне нормальным и естественным делом, то этого нельзя сказать о странах Запада. Там возникали трудности психологического характера, вызванные попытками замены привычных устных форм контроля письменными. Например, в Англии сто лет ушло на слом консервативных традиций, препятствовавших применению письменных контрольных работ в учебном процессе, и еще сто лет на то, чтобы последние начали использоваться на приемных и выпускных экзаменах (Burt C. L. The Use of Psycological Tests in England / Sadler M. E. a. o.: Essays on examinations. London: MacMillan, 1936.).

В 1884 г. в США вышла первая книга с тестовыми материалами, содержавшая задания и ответы к ним с оценкой по пятибалльной шкале. В этой книге содержались задания по математике, истории, грамматике, навигации, давались примерные тексты для сочинений вместе с методом количественной оценки сочинений. Это был первый в истории случай использования простейших статистических расчетов в педагогической работе (Thorndike, E. L. Educational Measurements of Fifty Years Ago // J. of Educational Psychology. 1913, № 6. P.

Быстро распространявшаяся в США такая форма контроля знаний имела не только много сторонников, но и противников. Сообщается, например, о школьном инспекторе из Чикаго, запретившем в 1881г. проводить письменный контроль и обязавшем осуществлять перевод учащихся в очередной класс не на основе проверок, а опираясь исключительно на мнения учителей и директоров школ. Распространилось мнение, что никто лучше учителя не сможет оценить способности ученика, и потому экзамены и всякие другие формы контроля являются издевательством над здравым смыслом (Caldwell O. W., Courtis S. A.Then and Now in Education: 1Harcourt, 19p.). Этим было положено начало общественному движению против какого-либо контроля в школе. Пик такого движения в США пришелся на конец XIX века (1880-е годы), после чего вновь стали появляться предпосылки для формирования благожелательного отношения к контролю знаний.

История тестов. Конец XIX века

От вопросов предыстории тестов перейдем к истории тестов, которая началась в конце XIX века. Это был период революционного изменения общественного сознания, совпавшего, по времени, с научным кризисом, поразившим естествознание.

Родоначальником тестового движения можно назвать известного английского ученого Френсиса Гальтона. В годах он проводил серию испытаний для посетителей своей лаборатории. Туда приходили дети и взрослые, возраст испытуемых варьировал от 5 до 80 лет. За небольшую плату там определялись быстрота реакции, вес, жизненная емкость легких, сила кисти (сжимание известного каждому ручного динамометра; это изобретение Ф. Гальтона) сила удара кулаком, становая сила, рост, острота зрения. Кроме того, оценивались способности запоминать буквы и различать цвета, ряд физиологических возможностей организма и некоторые психические свойства. По полной программе было обследовано 9337 человек.

Дж. Кэттелл первым, вероятно, увидел в тестах средство измерения, казалось бы, не измеряемых свойств личности. В работе, опубликованной в 1890 г., он дал список 50 лабораторных тестов, к которым имелась стандартная инструкция. В той же работе подчеркивался научно-лабораторный характер испытаний. В частности, указывалось, что лабораторию следует хорошо оборудовать, во время тестирования в нее не допускаются зрители; все испытуемые одинаково инструктируются, они должны хорошо усвоить, что и как нужно им делать. Кроме того, делались рекомендации по подсчету баллов.

Большинство заданий Кэттелла и Гальтона можно сейчас назвать психомоторными заданиями, потому что их тестам явно не доставало стандартизации процедуры тестирования и правил интерпретации результатов. Надо ли говорить сколь непривычной оказалась идея измерения для педагогики и психологии конца XIX века. Практические потребности изучения способностей были сформулированы тогда в виде важной для педагогики и психологии проблемы исследования индивидуальных различий. Исследование этой проблемы и дало импульс к появлению первых тестов. Измерение с помощью тестов казалось тогда, а многим педагогам по гуманитарным дисциплинам кажется, и по сей день, делом если не странным, то претенциозным. Обыденное сознание исходит при этом из аналогии с физическими измерениями и рассматривает подобные попытки как математизацию, чуждую для их наук.

Можно сказать, что Россия конца XIX века позаимствовала, в основном, немецкий вариант проверки знаний. Здесь в те годы о тестах никто еще ничего не написал. Похоже, что в стране их не было.

Соответственно, не велась научная работа в этой области. Но уделялось внимание улучшению качества контроля знаний. В конце XIX века в печати обсуждался вопрос о введении экзаменов ( Быть экзаменам или не быть? // Образование. 1892. №5-6. С. 151-155; К вопросу об экзаменах в гимназиях // Русская школа. 1894. №9-10, С. 161-197.). В циркуляре по Санкт-Петербургскому учебному округу «О производстве испытаний зрелости без послаблений», сообщалось, что во многих гимназиях испытания зрелости производятся крайне снисходительно, с весьма большими послаблениями. А это обстоятельство, в свою очередь, весьма неблагоприятно отзывается на всем ходе учебного дела, приучая воспитанников поверхностно относится к усвоению преподаваемых им наук в надежде на ожидаемые послабления на испытаниях (Циркуляр по Санкт-Петербургскому учебному округу. 1901. №5(Май). С. 218.). В этом же циркуляре имеются поразительно точные слова о требованиях к содержанию контрольных материалов: «не обременяя требованиями мелких и второстепенных подробностей. необходимо удостовериться в знании существенно-важного в каждом предмете».

Первая попытка научного измерения интеллектуальных способностей детей была сделана в начале XX века. Это произошло во Франции. Авторы созданного для этой цели теста А. Бине и Т. Симон провели эмпирическую проверку заданий, претендующих на включение в тест. Для оценки работоспособности заданий теста авторы использовали два основных критерия: 1) эмпирическую меру трудности каждого задания, определявшуюся на группах детей разного возраста и 2) информацию о степени совпадения результатов теста с мнением преподавателей. Для достижения сопоставимости данных, полученных ими с данными других исследователей и минимизации ошибок измерения, А. Бине и Т. Симон приложили к тесту стандартную инструкцию по проведению тестирования.

Отрывок из другого документа явился, вероятно, главной причиной последовавшей затем процентомании, от которой российское образование не может оправиться и в наши дни. В постановлении «О порядке окончания в 1932/33 учебном году в начальной и средних школах» отмечалось, что «проводимые испытания являются формой государственного и общественного контроля не только за работой учащихся, но и за качеством работы учителя и школы в целом» (Бюллетень Народного Комиссариата по просвещению РСФСР. 1933. №8.).

История тестов. XX век

В СССР практика тестирования этого периода характеризовалась серьезными противоречиями: по мере роста числа тестов и тестовых исследований имели место попытки торможения и даже запрета. В печати появился ряд публикаций, в которых тесты отвергались, как говорится, с порога. В 1936 году было принято Постановление Совета Народных Комиссаров под многозначительным названием «О педологических извращениях в системе Наркомпроссов». Что на долгое время помешало попыткам разработки и применения тестовых методов в сфере образования, профотбора и профориентации. Хотя в тридцатых годах практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в нашей стране полностью не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний; и наоборот, различные испытания нередко назывались тестами. Официально запрет на применение тестов так и не был отменен. Его отменила сама жизнь.

В зарубежной литературе выделяется несколько источников критики тестов. Первый источник O. Brim усматривает в личностном портрете критиков. В числе последних чаще других оказываются те, кто не склонен к интроспекции, авторитарен в межличностных отношениях, нетерпим к мнению других и возражает против всяких социальных перемен. Как правило, в США эти лица примыкают, как он считает, к правым политическим группам, требующим запрещения тестов. Второй источник критики этот же автор видит в системе социальных ценностей, имеющей свои корни в отношении к вопросам равенства людей. Если в обществе одобряется принцип открытого соревнования его членов, то в каждом поколении на передовые позиции выдвигаются наиболее талантливые люди. В таком обществе каждый имеет возможность внести свой вклад в соответствии со своими способностями. Последние должны быть оценены, и потому ориентация на этот принцип создает благоприятное отношение к тестам. Третий источник, по мнению R. B. Cattel, является следствием эмоционального и сентиментального отношения людей эстетического и нарцисстического типа ко всякой попытке представить «уникальную, художественную личность», как он пишет, в виде формул и т. п.

Практика, как это часто бывает, опережала теорию. Массовые тестовые обследования не подкреплялись серьезной проверкой качества инструментария, решения о переводе некоторых учащихся в классы для умственно отсталых детей принимались на основе несовершенных тестов, без учета других факторов, влияющих на результат проверки. В промышленности на основе таких же тестов делались попытки классификации работников по различным профессиям, без внимательного учета личных склонностей и интересов.

В условиях авторитарно управляемого общества любой случай неправильной практики применения тестов легко идентифицировался с ошибочностью самого тестового метода. Положительные примеры их применения во внимание не принимались. Подобная ситуация имела место в период между 1931 и 1938 годами и затем повторялась (не в столь тяжелой форме) и в последующие периоды.

Тесты применялись в двух основных сферах: в образовании и в сфере профотбора-профориентации. Затронутые тестами столь важные сферы жизни и прямое влияние результатов тестового контроля на судьбы миллионов людей породили широкую гамму мнений в пользу и против тестов. Большой энтузиазм тех, кто их применял, и не меньший пессимизм тех, кто видел несовершенство этого метода или пострадал в результате его неправильного использования, породили во многих странах, в том числе и в СССР, письма в правительственные органы и в газеты с требованием запрета тестов.

— тесты используются в капиталистических странах, где с их помощью решаются вопросы расовой и классовой дифференциации;
— применение тестов унижает достоинство личности, особенно в случаях, когда получаемые баллы оказываются ниже среднего уровня;
— никакие методы измерения не могут заменить преподавателя и его личный опыт;

— в педагогике нет и не может быть точной единицы измерения, и потому не следует терять время, силы и средства на разработку неточных методов.

В этих утверждениях много спорного, и даже ошибочного. Что касается применения тестов для целей расовой и классовой дифференциации, то вряд ли здесь надо винить тесты. Как всякое средство, они могут быть использованы в пользу или во вред, в зависимости от идеологии, политики, компетенции, целевых установок и т. п. О возможном унижении достоинства личности, наклеивании ярлыков и т. п. можно сказать, что для предотвращения неприятных последствий такого рода, если это вообще возможно при культурной работе, разработаны специальные правила обращения с тестами и испытуемыми. В этих правилах все возникающие вопросы этического характера предусмотрено решать в пользу личности. Соблюдение этических норм является непременной частью профессиональной подготовки тех, кто работает с тестами. Тестовые методы не призваны заменять преподавателя и его личный опыт, а наоборот, призваны помогать ему, освободив его от рутинной работы и дать, тем самым, ему возможность сосредоточиться на повышении качества преподавания. Во-вторых, хотя точность педагогических измерений и не может сравниться с точностью физических измерений, преимущества первых, тем не менее, достаточно очевидны, они описаны повсеместно.

В соответствии с этой моделью стране в те годы навязывались суждения уравнительного характера: о возможности каждым человеком овладеть любой профессией, о равенстве способностей и одинаковой обучаемости, о равенстве в получении различных благ. В песнях пели: «Нам все пути открыты». Делались реальные попытки обеспечить все население посильной медицинской помощью, приемлемым уровнем зарплаты и т. п. Но при этом для укрепления властных структур вводились и различные льготы. Постепенно возрастал и уровень всеобщего обязательного образования, с 7 до 10 классов средней школы, т. е., решалась задача народного образования. Под влиянием эгалитаристских установок в педагогической среде актуализировалось множество расхожих афоризмов типа «незаменимых людей нет», «нет плохих учеников, есть плохие учителя», «не высовываться» и т. п. В стране, устроенной по эгалитарному принципу, люди рассматривались как взаимозаменяемые «винтики» общественной машины, управляемой Вождем. С начала тридцатых годов созрела идея тотального контроля, в рамках которой в системе образования вновь начала использоваться экзамены.

В середине тридцатых годов обнаружилась неадекватность системы оценки знаний задачам, поставленным партией перед советской школой. В Постановлении Совета народных Комиссаров и ЦК ВКП(б) от 3 сентября 1935 г. утверждалось, что «установленная наркомпроссами система оценки успеваемости не дает представления о фактических знаниях учащихся и ведет, на практике, к понижению уровня учебы». Там же поручалось отделу ЦК ВКП(б) «разработать, обязательно для всех школ СССР, нормы оценки успеваемости учащихся, с тем, чтобы один и тот же уровень знаний одинаково оценивался во всех школах». Ввиду неспособности учебного отдела ЦК партии решить эту методическую задачу, поручение так и осталось невыполненным. Не решили её и все последующие поколения руководящих деятелей союзного и российского образования.

Надвигалась вторая мировая война, для победы в которой требовались миллионы технически подготовленных специалистов. По всей стране открывались новые учебные и научно-исследовательские институты, военные училища. Промышленность постепенно переводилась на военные рельсы. Для отбора курсантов в летные училища создавались медицинские комиссии, которые и должны были заниматься вопросами если не подобия профессионального отбора, то хотя бы отбраковкой тех, кто не годился для исполнения летной работы по показателям здоровья. Тестов как системы заданий возрастающей трудности в этих комиссиях еще не было. В основном там использовались различные пробы, измерения уровня давления крови, пульса, проверялись способности различать цвета, реакция на звук, нервная проводимость, устойчивость к головокружению. Посредством контрольных нормативов проверялась и физическая подготовленность.

Для участия в этой работе были мобилизованы ученые, занимавшиеся вопросами измерения в психологии и в социологии. По начальному образованию это были, в основном, математики, занимавшиеся вопросами соответствующих психологических или социологических измерений. С началом войны почти все кадры так называемых психометриков были направлены в специально созданную воинскую часть на авиабазе Рандольфильд, для проведения там, на основе многостороннего тестирования, профессионального отбора и классификации готовящегося по всей стране персонала из числа летчиков, штурманов, мотористов и т. д. Поскольку война диктовала короткие сроки проведения исследования, а тестов не хватало, вся работа по профотбору, созданию и по проверке качества тестов велась параллельно. Например, из 550000 тысяч человек, подвергнутых тестовому контролю в одном, 1942 году, примерно только половина была допущена к обучению отмеченным профессиям.

Между тем, общественность продолжала высказывать сомнения в качестве используемых тестов. Поэтому было решено провести эксперимент. Хотя в рядах самих экспериментаторов не было единодушия, поскольку предстояло проверить эффективность их собственной работы. Среди аргументов, выдвигавшихся против эксперимента, были: нужен ли он в трудное военное время; а вдруг вскроются недостатки тестов, кажущихся сейчас вполне работоспособными, а главное, уже утвержденных руководством. » (US Army Air Forces Aviation Psychology Program // The Aviation Psychology Program in the Army Air Force. Ed by J. C. Flanagan. Washington: Goverment Printing Office, 1947. V.1. P.79.).

Экспериментальная группа состояла из 1143 человек, отобранном в случайном порядке из числа лиц, прошедших тестирование по полной программе и зачисленных на курсы подготовки военных летчиков, независимо от показанных ими результатов в тестировании. Контрольную группу составили свыше 230000 человек, допущенных к обучению в 1943 году в зависимости от полученных ими тестовых баллов. Результаты сравнения оказались следующими: в экспериментальной группе только 23 процента смогли закончить курс обучения, в то время как среди отобранных с помощью тестов процент успешно окончивших летные школы оказался более 60% (McFarland, R. A. Human Factors in Air Transportation. N. Y. McGraw-Hill, 1953. P. 43.). Различия, как говорят статистики, оказались весьма достоверными. Поскольку обучение военного летчика стоит дороже подготовки профессора, а отчисление неудачников проводилось, как правило, не ранее того, как курсанты проходили примерно третью часть срока подготовки, нетрудно было представить себе масштабы экономии средств за счет использования тестов. Один из активных участников процесса отбора военных специалистов посчитал, на каждый доллар, затраченный на эту программу, бюджет сэкономил тысячу долларов (Guilford, J. P. Is Personnel Testing Worth the Money? Gen. Mgmt. Ser. 1950. № 000. P. 52-64.).

Смысл введения латентной переменной требует краткого разъяснения. Она представляет собой простейшую форму реализации идеи существования скрытого фактора, влияющего на результаты испытуемых. Результаты теста всегда содержат в себе ошибки измерения, затрудняющие оценку истинного значения тестового балла на латентной переменной. Поскольку латентная переменная появляется в результате концептуализации, она всегда остается гипотетической переменной, на которой с большей или меньшей точностью оцениваются истинные результаты испытуемых. Латентная переменная представляет собой концептуальную модель интересующего исследователя качества испытуемых.

Попытки судить о невидимых вещах по видимым проявлениям имели место еще в глубокой древности. Так, например, Платон утверждал, что истинная астрономия занимается не изучением движения наблюдаемых небесных тел, а изучением законов движения звезд по математическому небу; несовершенным изображением последнего является видимое небо ( В поисках физики и квантовая теория / Пер. с англ. М.: Атомиздат, 1971. С. 13.). В эпоху возрождения скрытые качества рассматривались как некие силы, присущие всем вещам, причем каждая вещь представлялась как нечто двойственное: чувственно воспринимаемый предмет и внутреннее «скрытое качество», которое вызывало изменение наблюдаемых свойств. Эта идея вновь пробила себе дорогу в науке середины ХХ века.

Тесты. Советский период. История и теория

Хотя в тридцатых годах практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в СССР полностью не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний. И наоборот, различные испытания нередко назывались тестами. Практика тестирования характеризовалась серьезными противоречиями, что привело к запрету применения тестов в сфере образования, профотбора и профориентации.

Начиная с 30-х годов, в контроле знаний наметились две основные тенденции. Первая связана с применением традиционных форм и длительным, растянувшимся на полвека, периодом активного игнорирования тестов. Эта тенденция привела в наши дни к тотальному субъективизму в выставлении оценок, несопоставимости оценок, к образовательно-технологическому и организационно-педагогическому отставанию школы от общемирового образовательного процесса, к несопоставимым с имеющимся качеством выпускников большим затратам живого труда преподавателей. Не секрет, что исторически субъективность у нас всегда играла большую роль, чем объективность. В сфере образования это проявлялось в повсеместной приверженности к традиционным экзаменам, в то время как во многих странах уже давно тот кто учит не берется ставить итоговые оценки учащимся за свою же, по существу, работу. Там это считается нарушением профессиональной этики и потому общественное мнение склоняется в пользу независимого тестового контроля знаний.

В СССР условий для занятий тестами фактически не было, о чем может свидетельствовать личный опыт автора. Естественный научный дрейф от одной проблемы к другой привел меня к исследованию тестов, не востребованных в то время советской педагогической наукой. Для того, чтобы довести результаты своих поисков до педагогической общественности, пришлось тратить много сил для убеждения членов бывшей Академии педагогических наук в важности тестовой проблематики. При этом самыми трудными были попытки преодолеть у них тестофобию. Все было безуспешно.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *