quinta-feira, 22 de dezembro de 2016

115- COMPREENDENDO O ATO DE AVALIAR EM EDUCAÇÃO... MAIS UMA VEZ

Cipriano Luckesi
Contato - ccluckesi@gmail.com

INTRODUÇÃO

Já são muitos os anos que trabalho e investigo na área da avaliação em educação. Iniciei em 1968. Ao longo desses anos, muitos conceitos foram ganhando mais precisão epistemológica, como também metodológica e prática.
Neste texto, pretendo dar um pouco mais de precisão epistemológica à questão dos usos dos resultados da avaliação em educação, tema já mencionado e, de alguma forma, já trabalhado no texto imediatamente anterior, publicado neste blog.
Poderia abordar a questão do uso dos resultados do ato de avaliar em várias outras áreas da ação humana; contudo, como minha área de atuação é a educação, ater-me-ei a ela.
No texto, a seguir, retomo um pouco da história dos conceitos abordados, usualmente utilizados no cotidiano de nossas lides educativas --- exames e avaliação ---, e busco alguma precisão epistemológica, procurando compatibilizar o conceito com a realidade que ele expressa.
Iniciei essa tarefa já em alguns textos anteriores a este. O leitor poderá encontrar abordagens repetidas, porém necessárias, para que este texto se configure no seu todo.


1. UM POUCO DE HISTÓRIA PARA COMPREENDER ONDE ESTAMOS

A escola, que conhecemos hoje, como uma instituição de ensino, foi organizada no decurso do século XVI, sendo composta por uma administração educativa e por grupos de estudantes reunidos em turmas e, a frente dela, um professor para ensinar coletivamente a todos.
O ensino, anterior a esse momento histórico, praticamente, era individualizado, no âmbito das Oficinas de Mestres e Aprendizes, sempre tendo um mestre à frente. Só para lembrar, Leonardo Da Vinci frequentou a Oficina de Verrocchio --- propriamente: Andrea di Francesco di Cione, conhecido como Andrea del Verrocchio. Em cada Oficina ingressam poucos aprendizes, por isso, eram individualmente acompanhados pelo seu mestre.
Então, no contexto da escola que se instala no Ocidente com os eventos da Modernidade --- cujo marco histórico é o Século XV ---, após um ano letivo, comumente, são realizadas provas, tendo em vista a verificação da aprendizagem dos estudantes, classificando-os em aprovados, reprovados, tendo em vista o prosseguimento de seus estudos em séries ou classes subsequentes, segundo a estrutura curricular adotada. Ainda, no momento histórico contemporâneo, continuamos com essa prática, acrescida, evidentemente, com de outras minúcias. Contudo, o pano de fundo continua sendo esse. Todos nós, que passamos pela escolaridade, vivemos isso.
Na Ratio Studiorum, documento publicado pela Ordem dos Padres Jesuítas, em 1599, que estruturou a pedagogia em seus Colégios, esparramados pelo mundo, quanto à aprovação ou reprovação do estudante.
Quando a essa prática, do documento propunha duas atividades: uma de acompanhamento do estudante durante o ano letivo, cujos resultados deveriam ser anotados na Pauta do Professor (uma caderneta) e levados em conta por ocasião dos exames, ao final do ano letivo, quando se decidia pela aprovação ou reprovação do estudante; podendo ainda chegar-se a uma terceira posição --- o médio ---, que, sendo uma classificação duvidosa, possibilitava o estudante iniciar o ano letivo seguinte na classe imediatamente superior àquela que frequentava; caso apresentasse condições de prosseguir nessa classe, permanecia nela, mas, caso se mostrasse em condições insatisfatórias para tanto, retornava à classe anterior.
A Pauta do Professor continha os registros realizados pelo professor do estudante a respeito de seus caminhos, sucessos e fracassos na aprendizagem no decurso do ano letivo, decorrente dos procedimentos e processos de ensino-aprendizagem.
Os exames, por sua vez, que ocorriam ao final do ano letivo, eram realizados por uma Banca Examinadora, constituída por três membros: pelo Prefeito de Estudos da Escola (um administrador acadêmico da escolar; vale observar que o professor do estudante não podia fazer-se presente na Banca Examinadora) e por mais dois professores alocados em outra ou outras escolas.
Essa Banca tinha por tarefa realizar tanto os exames escritos, elaborando e corrigindo as provas, que eram aplicadas na turma de estudante pelo Prefeito de Estudos, como também era responsável pelo exame oral, com perguntas e situações-problema apresentadas ao estudante, que também, de forma oral, deveria responder ou realizar as tarefas propostas.
O desempenho e a respectiva classificação do estudante nesse ritual permitia ser aprovado ou reprovado no que se referia ao prosseguimento dos estudos na classe subsequente.
Esse ritual, ainda que com nuances e configurações diferenciadas, permanece sendo praticado em todos os níveis de ensino até o presente momento histórico, em todos os recantos geográficos do Ocidente, assim como em muitos outros cantos do Oriente.
Todos nós o conhecemos, seja pela experiência de termos sido estudantes, seja devido ocuparmos o lugar professores. Esse ritual tornou-se um senso comum ao longo da história moderna.
Já do lado protestante, especialmente nas configurações pedagógicas propostas por John Amós Comênio --- o mais importante pedagogo dessa orientação religiosa, nos finais do século XVI e inícios do XVII, que sistematizou orientações pedagógicas, publicadas em sua obra de 1632, intitulada Didática Magna ou da arte de ensinar todos totalmente ---, está definida a importância dos exames escolares, posteriormente, redefinidos na obra Leges Scholae bene ordenatae, do ano de 1654, na qual estão propostos exames ao final de cada aula, ao final de cada dia de aula, ao final de cada semana, de cada quinzena, de cada mês, ao final de cada semestre e ao final do ano letivo. E, ainda propôs um exame a ser praticado junto a todos os estudantes pelo Scholarca, um personagem nomeado por cada município para acompanhar a qualidade do ensino e aprendizagem em cada escola, como instituição.
Dessas experiências dos inicios da organização escolar, no alvorecer da modernidade, emergiu a prática pedagógica mais centrada nos denominados exames escolares que, propriamente, no ensino-aprendizagem dos educandos.
Em tempos passados, final dos anos 1980 e inícios dos anos 1990, escrevi um texto, que se encontra publicado num livro de minha autoria intitulado Avaliação da aprendizagem escolar: estudos e proposições, Cortez Editora, São Paulo, 22ª edição, cujo título é “Avaliação da aprendizagem escolar: apontamentos sobre a pedagogia do exame”, páginas 35 a 44, onde demonstro a polarização dos exames em nossas práticas do ensino-aprendizagem, seja por parte do professor, dos estudantes, dos pais, da direção da escola e da sociedade.
Todos têm sua atenção voltada para os exames escolares. Os professores ameaçam os estudantes com os exames --- “Estudem, caso contrário, verão o que acontecerá no dia dos exames”. Os pais perguntam: “Meu filho, já estudou para as provas”? “Que nota tirou”? Um estudante comenta com o outro: “Rapaz, não estou muito bem para a prova de hoje”. E, assim, por diante.... Todos polarizados pelas provas, que se traduzem em exames.
Então, do século XVI ao século XX, nenhum autor criou outra denominação para essa prática escolar. Nesse período, e ainda hoje, nos servimos da denominação utilizada pelos jesuítas: “exames escolares”.
Em 1930, um jovem educador norte-americano, Ralph Tyler, nascido em 1902 e falecido em 1994, preocupado com os altos índices de reprovação escolar nos Estados Unidos, naquele momento, --- em torno de 70% dos estudantes ---, passou a utilizar a denominação de “avaliação da aprendizagem” para insistir no uso “diagnóstico” dos resultados da investigação da qualidade das aprendizagens dos estudantes, com a intenção de que os educadores pudessem compreender que, quando um estudante ainda não aprendeu um determinado conteúdo ou habilidade, vale a pena investir mais e mais nele, até que aprenda.
A prática daquilo que ele denominou de “avaliação da aprendizagem”, então, serviria para denunciar que o estudante --- ainda --- não aprendeu aquilo que deveria ter aprendido, como também um aleta ao educador para que invista mais e mais na aprendizagem do seu educando, caso ele efetivamente tenha o desejo de que aprendam aquilo quem está ensinando.
Essa compreensão de Tyler, ao longo do tempo, teve repercussões teóricas tanto nos Estados Unidos como em outras partes do mundo, inclusive no Brasil, quarenta anos depois, a partir do final dos anos 1960 e inícios dos anos 1970.
No final dos anos 1950 e 1960, nos Estados Unidos, especialmente com os largos investimentos em educação ocorridos nesse país pós o lançamento do Sputinik I, por parte dos russos. A Rússia, um país medieval no início do século XX, em quarenta anos, desenvolvera ciência e tecnologia com capacidade de colocá-la como o primeiro país a enviar um satélite artificial no espaço.
Então, o governo norte-americano, nas variadas disputas internacionais, considerando que a educação não estava dando conta de criar cientistas e tecnólogos suficientes, competentes e criativos, investiu financeiramente muito em educação e, ao mesmo tempo, tendo em vista verificar e controlar os efeitos desses investimentos, no contexto da cultura educativa desse país, desenvolveram-se múltiplos modelos de avaliação, tendo em vista verificar os efeitos de tais investimentos na vida social. Também se desenvolveram metodologias tanto para o ensino como para a avaliação, tendo em vista tornar as práticas de ensino-aprendizagem mais eficientes.
No Brasil, as repercussões desses movimentos em torno da eficiência do ensino e das práticas avaliativas chegaram pelo final dos anos 1960 e inícios dos anos 1970. Tivemos a Reforma da Universidade em 1968 e a Reforma do Ensino Básico em 1971 e, junto com essas reformas, todo um movimento de eficientização do ensino, em função do que a avaliação se tornava recurso fundamental.
Importa observar que, na escola regular, o movimento pró avaliação não deu conta de ultrapassar as práticas dos exames escolares, no caso, já seculares. Então, hoje, em nossa cultura pedagógica, abordamos e dialogamos sobre a avaliação, mas continuamos, no cotidiano, a praticar os velhos exames escolares jesuíticos e comenianos.
Então, no decurso do século XX e no presente momento, seguimos nos servimos das denominações e dos conceitos de exames escolares, como classificatórios, e avaliação, como diagnóstica; modo de agir e pensar como ainda plenamente vigentes em nossas cotidianas práticas pedagógicas escolares.
Até mesmo desenvolvemos terminologias agregadas aos termos “exames” e “avaliação”, tais como “exames escolares”, “avaliação classificatória”, “avaliação diagnóstica”, “avaliação processual”, “avaliação contínua”, “avaliação mediadora”, “avaliação dialógica”, “avaliação dialética”, entre outras...
Todas elas na perspectiva de esclarecer e passar e, consequentemente, servir-se da avaliação como um recurso subsidiário de uma ação bem-sucedida em educação. É em função dessa multiplicidade terminológica, que tenho me dedicado a buscar mais precisão epistemológica para os conceitos, na expectativa de uma melhor compreensão teórica sobre avaliação possa permitir também praticas diárias mais consistentes.
Pessoalmente, participei de todos esses movimentos nos últimos quarenta anos da educação no país. Usei de todas as expressões e entendimentos disponíveis em nossa cultura e em expressões culturais de outros países, acima relembradas. Ultimamente, tenho me dedicado a refinar os conceitos no âmbito da avaliação em educação e este texto também faz parte dessas tentativas. O leitor poderá verificar os últimos textos publicados aqui neste blog. E, nesse texto insisto, mais uma vez, nessa busca de refinamento dos conceitos nessa área de trabalho.


2. APRIMORAMENTO DOS CONCEITOS RELATIVOS AO ATO DE AVALIAR EM EDUCAÇÃO

1. A respeito do conceito do ato de avaliar

Todos aqueles que já entraram em contato com os textos que escrevi, em especial, sobre avaliação da aprendizagem, já se depararam com exposições diferenciando “exames escolares” de “avaliação da aprendizagem”, em conformidade com os dados que indiquei na primeira parte deste texto. Os exames como classificatórios e excludentes e a avaliação como diagnóstica e inclusiva.
Mais recentemente, tenho me perguntado sobre a justeza epistemológica desses conceitos, assim como a respeito da compreensão conceitual do ato de avaliar, que assimilei de Stuffblean, que define a avaliação como “um juízo de valor (qualidade) sobre dados relevantes, para uma tomada de decisão”.
A medida que venho apurado mais e mais os conceitos sobre avaliação, passei a compreender que o ato de avaliar é um “ato de investigar a qualidade da realidade”, encerrando-se aí o seu algoritmo.
Diante dessa constatação, fica claro que a “tomada de decisão” não pertence propriamente ao ato de avaliar, mas sim à atitude do gestor de uma ação que, com base na qualidade da realidade identificada pela investigação, “decide” o caminho a tomar, tais como: a) “deixar as coisas como estão e nada fazer”, ou b) “dar-se por satisfeito com a qualidade da realidade identificada pela investigação” ou ainda, c) “reconhecer que a qualidade da realidade está insatisfatória e decide investir mais e mais na perspectiva de produzir mais satisfatoriedade”.
Essa compreensão mostra que a avaliação é uma investigação e, como tal, “revela a qualidade da realidade”, podendo, então, subsidiar decisões do gestor da ação, contudo, ela, por si, não resolve nada; ela simplesmente produz um conhecimento da qualidade da realidade. Quem toma a decisão é o gestor da ação, com base na qualidade revelada da realidade, fator que faz compreender que o ato de avaliar se encerra com a qualificação da realidade.
Com essa compreensão do ato de avaliar, que acredito ser epistemologicamente mais justa e adequada, coloca nas mãos do gestor a decisão e o investimento. O ato de avaliar revela a qualidade da realidade. Ponto final. Cabe ao gestor tomar decisão e investir.
Já há muito falamos de “avaliação em educação” --- de os inícios dos anos 1970 ---, e, parece, que ficamos a acreditar que ela, por si, resolveria os impasses educacionais que vivemos. No, então, não resolve e a razão é simples: ela é uma investigação e a função de um a investigação é simplesmente revela a realidade. Nada mais que isso. Com essa revelação em mãos, é o gestor que produzirá resultados. Na sala de aula, o educador é o seu gestor e, então, deverá ser ele o divisor de águas entre a ineficiência e a eficiência da ação educativa. Em outras instâncias educativas, outros gestores serão responsáveis pela produção dos resultados desejados.

1..2. A respeito dos usos dos resultados ato de avaliar

O ato de avaliar, sempre foi somente isso --- “investigar a qualidade da realidade” ---, desde que o ser humano emergiu na terra.
Contudo, foram realizados usos diferenciados dos resultados dessa prática investigativa. No caso da educação organizada institucionalmente, ao ”uso classificatório dos resultados” dessa prática investigativa foi atribuída a denominação de “exames escolares”. Mais recentemente --- na primeira metade do século XX, ---, Ralph Tyler resolveu batizar o “uso diagnóstico dos resultados” dessa prática investigativa de “avaliação da aprendizagem”. E, então, hoje, cotidianamente, utilizamos essas denominações como se fossem absolutamente diferentes e até opostas. Eu, pessoalmente, também já cometi esse engano, até mesmo em meus escritos. A pratica investigativa é a mesma, todavia, os usos dos resultados da investigação é que são diferentes e até opostos.
Recentemente, tenho entendido que os jesuítas no século XVI, assim como os comenianos, também praticaram avaliação, contudo, usaram e propuseram usar os resultados dessa prática investigativa de modo “classificatório”, denominando esse uso de “exames escolares”. Por outro lado, tenho compreendido que Ralph Tyler desejou e propôs que o uso dos resultados do ato avaliativo em educação tivesse um uso “diagnóstico”, tendo denominado essa prática de “avaliação da aprendizagem”.
Em síntese, esclarecendo epistemologicamente o conceito de “avaliar”, podemos compreender, sim, que tanto por trás daquilo que denominamos “exames escolares”, como por trás daquilo que denominamos “avaliação da aprendizagem”, está a “investigação avaliativa”, que se encerra no momento que essa prática investigativa “revela a qualidade da realidade”; fator que propicia os dois usos básicos de sua revelação: um uso classificatório e um uso diagnóstico. E, mais, tanto um quanto outro desses usos propicia desdobramentos.
O uso classificatório se expressa numa escala de qualidades e pode se desdobrar em premiação e castigo; o uso diagnóstico propicia bases para as decisões construtivas. O uso classificatório encerra um processo de ação; o uso diagnóstico abre as portas para prosseguir. O uso classificatório tem desdobramentos excludentes --- alguns ficam, outros vão; o uso diagnóstico tem desdobramentos inclusivos --- sempre os resultados podem ser melhores.

Concluindo - Vale a pena rever esses conceitos.




========================================================================

quinta-feira, 15 de dezembro de 2016

114 - COMPREENDENDO A AVALIAÇÃO EM EDUCAÇÃO: questões epistemológicas e práticas

Cipriano Luckesi
Contato --- ccluckesi@gmail.com



INTRODUÇÃO

No texto que se segue, o leito encontrará três tratamentos da fenomenologia da avaliação em educação. O título 1 cuida o conceito do ato de avaliar, concebido como ato de investigar a qualidade da realidade. O título 2 desdobra o primeiro e está comprometido com os usos dos resultados do ato avaliativo --- uso classificatório e uso diagnóstico. E, o título 3 está articulado propriamente com a fenomenologia da prática da avaliação em educação: da aprendizagem, institucional e de larga escala.


1. COMPREENSÕES EPISTEMOLÓGICAS ESSENCIAIS
1.1. O ato de avaliar é constitutivo do ser humano

O ato de avaliar nasce com a emergência do ser humano no planeta. Ele faz parte dos seus dois âmbitos de práticas de conhecimento, que são universais, ou seja, todo ser humano conhece “fatos” --- incluindo aí todas as nuances específicas do ato de conhecer, relativas ao senso comum [conhecimento cotidiano] ou ao senso crítico --- [filosofia, ciência, artes...]---, como também todo ser humano conhece “valores” [avalia], seja pelo senso comum emocional [os julgamentos emergem intempestivamente de dentro de nós, nem sabemos de onde eles vêm; o certo é que eles vêm]), seja por recursos conscientes e metodologicamente praticados (investigação avaliativa intencional).
Em síntese, o ato de avaliar é constitutivo do ser humano. Não existe conduta humana que não tenha sido escolhida --- consciente ou inconscientemente --- com base em alguma qualificação da realidade. A qualificação da realidade subsidia nossas escolhas, que acreditamos sempre ser a melhor, dede que ninguém escolhe alguma prática, algum ato, tendo em vista obter resultado negativo. Sempre escolhemos na expectativa de que obteremos um resultado positivo, ainda que esse positivo possa ser positivo somente para nós, e não para os outros no nosso entorno ou para a humanidade.
Não existe ato humano que não seja precedido de uma avaliação, seja essa avaliação inconsciente ou consciente. Usualmente, as avaliações inconscientes implicam em atos intempestivos; somos tomados por eles; mas, as avaliações conscientes nos subsidiam a entrar a melhor solução para os impasses com os quais nos defrontamos no dia a dia. A avaliação, ao lado do conhecimento factual, é constitutiva de cada um de nós.

1.2. O ato de avaliar:  considerações epistemológicas


a). Primeiro passo do ato de avaliar: descritiva da realidade


Epistemologicamente, o ato de avaliar é um ato de investigar a qualidade da realidade, o que implica em proceder uma descritiva e uma leitura da mesma.

Então, o primeiro passo do ato de avaliar é a descritiva da realidade, sobre a qual incide sua leitura. À semelhança do que ocorre no âmbito da ciência, o ato de avaliar tem um objeto a ser avaliado, o que exige sua configuração (sua descritiva), através de sua observação segundo variáveis, necessária e precisamente definidas.
Vamos para um exemplo do cotidiano, que, de alguma forma, possa sinalizar como opera o ato de avaliar. Apresentarei o exemplo na primeira pessoa para facilitar a compreensão.
Então, me dirijo a um shopping, tendo em vista comprar uma roupa, para usá-la numa cerimônia de casamento. Como exemplo, utilizo a compra de uma roupa masculina, mas que poderá ser aplicada em qualquer aquisição que alguém estiver praticando.
Em frente à vitrine da loja, observo os variados termos expostos. Que variáveis se fazem presentes à observação, que sucessivamente irão oferecendo base para minha avaliação do produto a ser adquirido?
Muitas: em primeiro lugar, levo em conta a variável do terno, tomado no seu todo, exposto na vitrine; mas, a seguir, vem a variável “côr”, seguindo-se outras variáveis, que me conduzirão à descrição do objeto do meu desejo, tais como “modelo”, “design”, “detalhes de costura”, “combinação com camisa”, “com os sapatos que irei usar”, “com minha figura pessoal”, “preço” ... Cada variável é, em primeiro lugar, observada e, subsequentemente, “descrita” em minha mente e, depois, será “qualificada”, gerando bases para minha escolha de como agir (adquirir, ou não, a determinada roupa). A descritiva é a base do ato avaliativo.
Então, decido entrar na loja. Lá dentro, tomo o terno nas mãos e observo melhor os detalhes anteriormente já percebidos, dialogo com o vendedor sobre o preço do produto. No caso, todas as variáveis são observadas e “descritas” (descritiva); a seguir, após comparar as descritivas com aquilo que considero satisfatório (qualificação), decido comprar o terno, ou não (tomo a decisão, assentado na avaliação)
Em síntese, o ponto de partida da avaliação é a descritiva da realidade. Usualmente no cotidiano, fazemos isso pelo senso comum, instantaneamente, de tal forma que nem mesmo parecerá que tenhamos praticado uma “observação” e, em decorrência, tenhamos realizado uma “descritiva” do objeto de nosso interesse, tendo em vista qualificá-lo e, a partir daí, decidir por adquiri-lo, ou não. Essa instantaneidade no cotidiano ocorre devido ao fato de que, nesse contexto, o ato avaliativo se dá sem o uso de uma metodologia criticamente constituída.
Passemos, agora, a tratar de uma prática do ato de avaliar conduzida de forma metodologicamente consciente e consistente, também tendo em vista perceber que o primeiro passo dessa prática é sempre a descritiva do objeto.
Exemplificando, você ou eu vamos ao médico. Certamente que, na avaliação do nosso estado de saúde, o profissional não agirá no seu diagnóstico de forma equivalente à conduta, descrita acima, a respeito da aquisição de uma roupa.
Sendo um profissional competente em sua atividade, o médico seguirá conscientemente passos metodológicos rigorosos para obter a melhor descritiva de nosso quadro de saúde.
Para tanto, de início, fará uma anamnese (retomada de todas as nossas queixas); a seguir, fará um exame clínico (observação do nosso corpo naquilo que for pertinente à queixa que estamos levando); por último, tendo em vista completar sua coleta de dados a respeito de nosso quadro de saúde, prescreverá exames de laboratório (fezes, urina, sangue...), prescreverá ainda exames de imagem (ultrassom, tomografia, ressonância magnética...).
Com os resultados de todas essas coletas de dados sobre meu estado de saúde --- portanto, com uma descritiva em mãos ---, o médico fará a efetiva avaliação de minha saúde, tendo presente as queixas que apresentei em meu primeiro contato com ele, assim como os parâmetros de sanidade referente a cada uma das variáveis que levou em consideração. Uma avaliação metodologicamente consistente tem como base uma consistente descritiva da realidade, assim como consistentes parâmetros de qualificação de cada uma das variáveis consideradas. Sem isso, ocorrem enganos.
Sintetizando, para praticar a avaliação (como ato investigativo da qualidade da realidade) --- seja através do senso comum, seja através do senso crítico ---, necessitamos, como sua base, de uma descritiva do objeto da investigação, o que implica em coleta de dados sobre mesmo, segundo um conjunto de variáveis selecionadas para tanto. No senso comum, a coleta de dados ocorre usualmente de modo espontâneo e, por vezes, superficial; no âmbito do senso crítico, a coleta de dados obrigatoriamente deve ser conduzida metodologicamente de modo consciente e consistente.
Para haver uma consistente descritiva da realidade, há exigência de uma rigorosa coleta de dados que lhe dê base.
Em qualquer investigação, e também no caso da avaliação como investigação da qualidade da realidade, necessitamos de recursos técnicos que nos possibilitem “coletar os dados” que a caracterizem e a descrevam. Contudo, como nossa capacidade de observar e descrever a realidade é limitada, necessitamos de recursos (instrumentos técnicos) mediadores que ampliem nossa capacidade de observá-la e descrevê-la.
Por exemplo, como observar o solo lunar e descrevê-lo, sem um potente telescópio? Como observar micro-organismos e descrevê-los, sem um microscópio? Como coletar a opinião de cidadãos sobre fatos e acontecimentos, sem entrevistá-los? Como poderíamos saber aquilo que o outro está sentindo, se não lhe perguntamos?
No processo de coletar dados, criticamente --- portanto, de forma consciente e explícita --- para descrever uma realidade, importa usar instrumentos de coleta de dados, metodologicamente estruturados, que podem variar desde um roteiro de observação, um roteiro de entrevista, um questionário, a instrumentos óticos, físicos, bioquímicos e outros mais, que viabilizem coletar dados essenciais e, consequentemente, descrever a realidade da forma mais precisa possível.
Sem uma cuidadosa coleta de dados --- tendo presente o objetivo de nossa investigação, assim como as variáveis que compõem o objeto de nosso estudo e que desejamos descrever ---, podemos nos enganar nas afirmações que viermos a fazer a respeito dessa realidade, seja do ponto de vista do seu funcionamento (ciência), seja do ponto de vista de sua qualidade (avaliação).
Caso nossos recursos de coleta de dados estejam elaborados de forma inadequada ou insatisfatória, nossa descritiva da realidade será distorcida, o que, consequentemente, gerará uma qualificação também distorcida, dede que esta se assenta sobre aquela.
Uma satisfatória descritiva da realidade será inviabilizada, caso os dados coletados --- seja por uma distorção ideológica, seja por uma distorção metodológica --- não descreva com a precisão necessária o objeto da atividade de investigação. Ao abordar a questão da avaliação em educação, especialmente da aprendizagem, retomaremos a questão da coleta de dados.

b). Segundo passo do ato de avaliar: atribuição de qualidade à realidade descrita

A avaliação, como a investigação da qualidade da realidade, tendo por base sua descritiva, implica em sua qualificação. A qualificação, que, epistemologicamente, se apresenta como a essência do ato avaliativo, refere-se a “uma atribuição de qualidade à realidade”. A descritiva da realidade, como já sinalizamos anteriormente --- e aqui reforçando ---, tanto serve de base para ciência como para a avaliação; no caso da ciência, possibilita compreender sua constituição e seu funcionamento; no caso da avaliação, possibilita uma qualificação consistente.
Como se chega à qualificação da realidade, o segundo passo do ato avaliativo?
Atribuição de qualidade à qualquer realidade --- factual, psicológica, cultural, religiosa, emocional, entre outras --- se processa através de uma comparação da realidade descrita com um padrão/critério de qualidade, assumido como satisfatório.
Se as características da realidade descrita preenchem o critério de qualidade, atribuímos a ela a qualidade plenamente positiva; caso esteja aquém do critério, atribuímos uma qualidade que, usualmente, expressa através de uma escala de qualidades, variando entre os extremos de positividade e negatividade.
Existem os critérios que atuam e que usamos espontaneamente no cotidiano, no nível do senso comum, em função do qual emitimos nossas opiniões, que, na quase totalidade das vezes, trazem a marca da subjetividade individual, vinculada aos estados emocionais de cada um de nós. As expressões --- “Para mim, é assim”; “Eu sinto que dessa forma”, entre outras --- expressa bem essa fenomenologia.
Todavia, também existem critérios consistentes, metodologicamente traçados a partir de estudos e pesquisas sobre a qualidade necessária de determinada realidade ou de determinada conduta.
Por exemplo, qual a conduta satisfatória de um piloto de um avião comercial? Qual a conduta satisfatória de um cirurgião cardíaco? Qual a qualidade que deve ter uma laje ou uma viga na construção de um determinado prédio residencial? Qual é o critério para avaliar a qualidade da conduta de um psicoterapeuta ao atender um cliente?
Critérios de qualidade para essas realidades e práticas, assim como para muitíssimas outras são estabelecidos tendo por base estudos e pesquisas nas diversas áreas de conhecimento e ação. Tanto o estabelecimento como o uso desses critérios ocorrem --- e devem ocorrer --- de modo intencional, nunca de forma comum e espontânea. No Brasil, a ABNT (Associação brasileira de Normas Técnicas) oferece parâmetros de qualidade para múltiplas atividades humanas, no país.
Um exemplo do cotidiano, para permitir a percepção de como funciona a qualificação no ato avaliativo. Vamos retomar o exemplo do alfaiate, utilizado anteriormente neste texto. Ao produzir uma roupa para um cliente, o profissional da costura poderá levar em consideração múltiplas variáveis para qualificar sua obra, , e, para cada variável levada em consideração, haverá necessidade também de um critério de qualidade.
No caso, se esse profissional da costura estiver verificando a qualidade da roupa feita em relação à variável “adequação ao corpo do cliente”, terá que usar como critério de qualidade o “corpo do cliente”, desde que a roupa deverá estar adequada ao seu corpo. Mas, vamos supor que, somando-se à variável anterior, estará se dedicando a avaliar como cumpriu o design solicitado para fazer a roupa. Então, caberá perguntar pelo critério de avaliação, que nesse caso, seria o design contratado pelo cliente.  Com isso, podemos perceber que o ato de avaliar não necessariamente estará levando em consideração uma única variável, assim como um único critério de qualidade.
Dever-se-á levar em conta quantas variáveis e quantos critérios forem necessários para qualificar o determinado objeto em foco no ato avaliativo. Por vezes, um objeto de investigação avaliativa --- como na investigação científica --- exigirá que se leve em conta múltiplas variáveis e, no caso da avaliação, também múltiplos critérios de qualidade.
Imaginemos, agora, um engenheiro, um arquiteto, um bioquímico, um professor em sala de aula... todos eles deverão ter presente as variáveis e os critérios, intencionalmente construídos, para orientar e aquilatar os resultados de sua ação. Condições equivalentes do ato avaliativo serão exigidas para qualificar qualquer outro objeto material, cultural ou psicológico, de conduta, de atitude, resultados de ações variadas, entre outros objetos passíveis de atos avaliativos.
Para facilitar a compreensão do procedimento avaliativo, podemos nos servir das categorias gramaticais “substantivo” e “adjetivo”. Pela gramática, aprendemos que o substantivo “descreve a coisa”, à qual ele se refere; e o adjetivo “qualifica o substantivo”, isto é, qualifica aquilo que está descrito pelo substantivo.
O substantivo está vinculado, ao aspecto factual da realidade e o adjetivo à qualidade atribuída à realidade. O substantivo atém-se à descritiva da realidade; o adjetivo está comprometido com sua qualificação. A descrição é única, mas a atribuição de qualidade por variar para mais ou para menos.
Epistemologicamente, se diz que a qualificação exige uma posição de “não-indiferença” em relação à realidade, isto é, diante da realidade, pode-se considerá-la positiva ou negativa. O substantivo, desde que é descritivo, é único (“é/não é”), a qualificação, por sua vez, pode variar entre os dois polos (“positivo-negativo”), por isso se diz que ela é bipolar. Por isso, então, dizemos que “alguma coisa” (substantivo) é “plenamente positiva”, ou plenamente “negativa”, com todas as variações possíveis entre esses dois polos, sem que a qualidade deixe de estar referida a “alguma coisa”.
A exemplo, podemos relembrar que uma “mulher bela” não deixará de ser “mulher” (substantivo) se for considerada somente “bonita” (adjetivo); coisa semelhante ocorre com um ato considerado “justo” ou “injusto”, situação na qual ambas as qualidades (positiva e negativa) referem-se à mesma realidade (o substantivo “ato”), ocorrendo somente uma variação de qualidades (adjetivo) e o substantivo (realidade) permanecendo intacto). A qualidade atribuída somente qualifica a realidade, não a modifica em sua essência. O que pode modificar uma realidade é a sua modificação substantiva, ou seja, fenomenológica.
O ato de avaliar, pois, se encerra com a qualificação da realidade, que, pois, expressa o resultado da investigação avaliativa.


2. USO DOS RESULTADOS DA INVESTIGAÇÃO AVALIATIVA

Existem duas possibilidades de uso dos dados do ato avaliativo: o uso classificatório e o uso diagnóstico. O primeiro, assume a realidade presente, avaliada, como definitiva, por isso, pode classificá-la; o segundo assume a realidade presente como transitória ou em construção, por isso, fará um diagnóstico, expresso num conhecimento que subsidia decisões a respeito dos movimentos e/ou de intervenções necessárias na realidade.
Essas duas modalidades de uso dos resultados dos atos avaliativos, sempre estiveram presentes na vida humana e na história a humanidade.
A modalidade classificatória ocorre sempre que o gestor de uma ação deseja estabelecer uma classificação da realidade tendo presente sua qualificação dentro de uma escala, que variará entre a qualidade máxima e a mínima --- primeiro lugar/último lugar; ótimo/péssimo; belo/feio.... No caso da prática educativa escolar no Brasil, a escala está, comumente, estabelecida por notas, registradas numericamente, variando de 0 (zero) a 10 (dez).
A modalidade diagnóstica subsidia decisões relativas a processos em andamento. Então, subsidia transições, a serem praticadas por gestores, sempre do menos satisfatório para o mais satisfatório, desde que o ser humano, em são consciência, aposta no sucesso de sua ação.
A decisão de um gestor em usar classificatoriamente os resultados do ato de avaliar, por si, configura que a ação já se encerrou e, por isso, essa classificação assume o lugar de “definitiva”; já o gestor, que está usando os resultados do ato avaliativo como diagnóstico, está admitindo que a ação ainda está em curso e pode ser modificada, usualmente, na busca de mais satisfatoriedade.
Os jogos, nas experiências históricas antigas, gregas e romanas, assim como em outras experiências socioculturais, sempre chegavam ao seu final com a classificação de alguns jogadores como os “melhores”, para tanto levando-se em consideração algum critério de avaliação do desempenho esportivo. A decisão de usar os resultados da avaliação de modo classificatório foi repetida no passado em inúmeras circunstâncias e continua sendo praticada no presente em amplas áreas da vida humana.
O uso classificatório dos resultados do ato avaliativo, de modo comum, tem desdobramentos tanto nas premiações, como nos castigos. Frente aos resultados de uma ação, classificada como plenamente satisfatória, premia-se os “melhores”; mas também frente aos resultados negativos obtidos, castiga-se aqueles de “pior” desempenho.
O uso diagnóstico dos resultados do ato avaliativo, diverso do classificatório, tem o desdobramento de ser inclusivo: tudo pode ser melhor do que já é, tudo pode ser refeito ou reconstruído
A curva estatística de Gauss --- denominada “curva normal” --- permite uma classificação de tudo o que existe entre inferior, médio e superior, sendo que a categoria “médio” é composta usualmente pela maioria dos indivíduos de uma população classificada; uns tantos são alocados na categoria “superior” e outros tantos na categoria “inferior”. Por essa razão, ela é considerada uma curva estatística simétrica, com o maior volume de indivíduos alocados no “médio” e menores volumes nas pontas “inferior” e “superior”; razão pela qual o desenho visual dessa curva estatística se parece com o perfil de um chapéu, alto no meio e raso nas abas.
Essa compreensão classificatória atinge também os atos educativos, como teremos oportunidade de sinalizar, um pouco mais à frente. Essa é a visão mais comum que se tem da distribuição da qualidade da realidade em grupos populacionais, inclusive de estudantes em sala de aula. A curva normal de distribuição apresenta um olhar conservador da realidade, que constantemente apresentará esse mesmo desenho: maior volume no espaço “médio” e menores volumes nas pontas “inferior” e no “superior”.
Por outro lado, quando resultado da avaliação for efetivamente utilizado de forma diagnóstica, subsidiando as decisões de construção de resultados de forma satisfatória, em decorrência de uma ação significativa, a curva estatística não será “normal”, mas sim assimétrica, o que implica que, toda a população avaliada estará alocada no ponto máximo de qualidade, desde que, para isso, foram dedicados múltiplos investimentos.
O uso classificatório dos resultados da avaliação está comprometido com aquilo que se considera no seu suposto ponto final. Uma construção concluída, um livro concluído, uma estátua concluída na sua produção, um guisado concluído na sua elaboração por um gourmet, uma roupa pronta.... Já o uso diagnóstico dos resultados da avaliação está comprometido com um processo construtivo, seja para a melhoria e aperfeiçoamento dos resultados de uma ação, seja para a requalificação de um resultado já obtido. O uso classificatório é estático; o uso diagnóstico é dinâmico.
Ainda vale uma observação relativa à compreensão de que um gestor (aquele que toma decisões e age) que atua junto a seres humanos --- um educador, por exemplo --- que tem o desejo claro de que “todos” os seus educandos cheguem ao topo da aprendizagem necessária, a curva estatística classificatória, que leva o nome de Gauss, seu criador, não será nada útil, a não ser para nos informar que não estamos investindo suficientemente em todos os nossos educandos, a fim de que atinjam a “mestria” no conteúdo que estamos ensinando.
Para aquele que efetivamente ensina (o que implica que o estudante aprende), importa que os resultados finais apresentem uma curva estatística assimétrica, ou seja, uma curva estatística onde a totalidade da população abordada estatisticamente se concentra no topo da escala. O fato de “todos terem aprendido o necessário” é muito diferente do fato de que uma maioria permanece no “médio” e alguns atingem o nível superior (satisfatório) e ainda um grande grupo permanece no “inferior” (insatisfatório).
Desse modo, o ideal do uso classificatório dos resultados da avaliação em educação --- no que se refere à aprendizagem dos estudantes --- é que o padrão ideal de aprendizagem passe a ser também o ponto da escala onde todos devem ser classificados. Para a prática educativa, só existiria, então, uma possibilidade: uma curva final assimétrica, com todos na ponta superior. No desdobramento do uso classificatório dos resultados da avaliação, havendo premiação, seria uma premiação para todos, desde que todos atingiram a mestria.


3. AVALIAÇÃO EM EDUCAÇÃO

Existem vários usos possíveis dos resultados do ato avaliativo em educação, tanto sob a categoria classificatória, como sob a categoria diagnóstica. Para iniciar, vamos nos conscientizar das três mais significativas possibilidades: avaliação da aprendizagem, avaliação institucional, avaliação de larga escala.

3.1. Avaliação da aprendizagem

Estamos nos referindo à avaliação da aprendizagem em sala de aula. Na sala de aula, tendo presente as características etárias, psicológicas e curriculares dos aprendentes, o educador, como gestor da sala de aula (aquele que investe na produção significativa de resultados), praticará o ensino, investindo na aprendizagem de todos, desde que todos vêm para a escola para aprender.
Isso implica em que o educador --- capacitado e competente no uso de teorias e práticas do ensino-aprendizagem --- deve ter plena consciência de sua ação e dos resultados que deseja produzir junto aos seus educandos, assim como pleno investimento necessário a fim de que os resultados de sua ação pedagógica sejam significativos.
Nesse contexto, o educador, como gestor da sala de aula, agirá ensinando, portanto, buscando um resultado positivo de sua ação, estabelecido e previsto no planejamento curricular, traduzido em plano de ensino, como guia para a ação pedagógica.
É no seio dessa prática de ensinar-aprender, que cabe a prática da avaliação da aprendizagem e, no caso, os seus resultados podem ser utilizados tanto sob a forma classificatória como sob a forma diagnóstica.
A forma classificatória foi usada ao longo da história, desde que a escola se organizou, sob forma como existe hoje, na sociedade ocidental, do século XVI para cá. A modalidade de uso classificatório dos resultados da avaliação, ao longo desse espaço de tempo, já secular, recebeu o nome de “exame escolar”.
Infelizmente, essa modalidade classificatória tem sido utilizada quase que de modo exclusivo, ao longo da história da educação ocidental, nos quinhentos anos do tipo de organização escolar que conhecemos.
É interessante observar que, quando os jesuítas, organizadores da moderna organização escolar, introduziram a prática dos exames escolares no decurso da segunda metade do século XVI, em suas escolas na Europa, como nas colônias europeias esparramadas pelo mundo, eles propunham também um investimento no ensino cotidiano, estabelecendo um ritual para as aulas, configurados da seguinte forma: (a) oração (eram --- e são --- religiosos católicos, então as atividades deveriam ser antecedidas de uma oração); (b) seguia-se, então, a preleção (exposição do conteúdo); (c) a seguir, vinham os exercícios relativos ao conteúdo exposto, tendo em vista sua assimilação ativa; (d) correção dos exercícios; (e) superação das dúvidas dos estudantes; (f) tarefa para casa. No dia seguinte, iniciava-se com a oração, correção dos exercícios do dia anterior; nova preleção, seguindo-se todo o ritual exposto anteriormente.
E, o professor deveria ter uma “Pauta” (uma caderneta), na qual registrava a situação de cada estudante de sua turma, em termos de seus sucessos nas aprendizagens. Essa pauta deveria ser utilizada pela Banca Examinadora por ocasião dos exames gerais, que ocorriam uma única vez, ao final do ano letivo, tendo em vista integralizar as condições de aprovação ou reprovação do estudante. Os exames gerais, no caso, eram precedidos de um ensino consistente, que deveria formar as competências dos estudantes.
Infelizmente, com o passar do tempo, os exames escolares se multiplicaram nas escolas, chegando a existir exames semanais, mensais, semestrais e anuais, obscurecendo a prática ativa do ensino, cujos resultados eram registrados na “Pauta” do professor, que tinha por objetivo garantir um acompanhamento de cada estudante ao longo do ano letivo, com os respectivos registros de suas aprendizagens.
No caso, o padrão de classificação era o ideal a ser alcançado em termos de aprendizagem por parte dos estudantes. Também vale registrar que nem na prática pedagógica jesuítica nem na história da educação ocidental, essa determinação construtiva fora efetivamente sustentada.
Na Ratio Studiorum, documento básico da pedagogia jesuítica, publicado em 1599, existe o capítulo das premiações em decorrência das classificações obtidas pelos estudantes no final de cada ano letivo. Os três primeiros colocados recebiam prêmios e elogios públicos. Então, mesmo tendo como orientação prática o acompanhamento do estudante através da “Pauta do Professor”, abriu-se o espaço para as consequências do uso classificatório --- senão de modo exclusivo, aos menos de modo predominante --- dos resultados da avaliação (à época, assim como posteriormente, e ainda até o presente momento, denominados de “exames escolares”).
Nesse contexto o registro da classificação do estudante em sua aprendizagem, vagarosamente, foi se tornando mais importante que a própria aprendizagem. As denominadas “notas escolares”, se tornaram independente da efetiva aprendizagem. Hoje ainda, ao invés de perguntarmos a um estudante --- “Como foi sua aprendizagem em tal conteúdo”? ---, perguntamos --- “Que nota tirou”?
Já, sob a ótica diagnóstica, como parceira do gestor em sua ação construtiva, sinalizando-lhe a qualidade dos resultados de seus investimentos, a avaliação praticamente passou a ser considerada desse ponto de vista a partir de 1930, com os entendimentos de Ralph Tyler de que a prática educativa deve produzir resultados positivos para todos os seus demandantes e, não para alguns poucos, considerados os melhores.
Ouso dos resultados do ato avaliativo, sob essa ótica, então, subsidia o gestor da ação pedagógica a tomar sucessivas decisões, a fim de que os seus estudantes aprendam o necessário. Importa acrescentar que, politicamente, deveria ser, “a fim de que ‘todos’ os seus estudantes aprendam o necessário. Então, a curva estatística de aproveitamento escolar será assimétrica. Ninguém na parte inferior da curva estatística de distribuição dos estudantes em sua aprendizagem, e todos na sua parte superior.
Qual seria o ideal de uso das modalidades --- classificatória e diagnóstica --- de avaliação na prática educativa escolar? A resposta é --- as duas modalidades---, com a condição de que esta afirmação seja compreendida de modo adequado e satisfatório.
O padrão classificatório expressará, como já sinalizamos acima, o padrão de qualidade necessário ao qual “todos” os estudantes devem chegar ao final do período de ensino; afinal, o topo da curva estatística que, obrigatoriamente, deverá ser assimétrica. Para tanto, importa que os educadores assumam como meta de sua ação pedagógica um ensino que possibilite classificar todos os estudantes no nível máximo da curva assimétrica, ou seja, que todos aprendam o necessário, estabelecido curricularmente e praticado em sala de aula. 
Já, a modalidade diagnóstica de uso dos resultados da avaliação deve ocorrer, no caso, subsidiando as decisões no decurso do processo de ensino, de tal forma que todos os educandos atinjam o nível classificatório máximo previsto, ou seja, que todos aprendam o efetivamente necessário, estabelecido no currículo escolar e traduzido no plano de ensino de cada professor.
A distorção ocorre quando os educadores só se servem da modalidade classificatória, pautados numa escala de qualidades, que vai do mais para o menos ou do menos para o mais, sem servir-se permanentemente da modalidade diagnóstica em todo seu percurso de ensino.
O uso mais comum --- ou quase que exclusivo ---, em todas as nossas escolas é o da modalidade classificatória dos resultados da avaliação da aprendizagem através de uma escala estabelecida entre extremos, tais como --- aprovado/reprovado; primeiro lugar/último lugar; aprendeu/não aprendeu --- mais próxima da “curva estatística normal de distribuição de uma população” do que de uma “curva assimétrica”, a nosso ver ideal para uma prática educativa consistente e significativa.
Além de compreender e praticar adequadamente as modalidades de uso dos resultados dos atos avaliativos, sob as óticas classificatória e diagnóstica, acima abordadas, torna-se fundamental compreender e praticar uma elaboração satisfatória dos instrumentos de coleta de dados da aprendizagem dos estudantes, pois que são os dados cuidadosamente coletados que subsidiam a qualificação, no caso, da realidade da aprendizagem dos estudantes. Só com dados coletados com precisão e cuidados metodológicos poderão subsidiar juízos de qualidade consistentes sobre a aprendizagem dos estudantes.
Infelizmente, para a prática cotidiana de coleta de dados sobre a aprendizagem dos estudantes em nossas salas de aula, os instrumentos de coleta de dados têm sido construídos e utilizados sem que se leve suficientemente em conta as qualidades necessárias de um instrumento satisfatório de coleta de dados, no contexto de uma prática investigativa.
Por vezes, no âmbito do senso comum, afirmamos que, se elaborarmos instrumentos de coleta de dados sobre a aprendizagem de nossos estudantes no limite daquilo e da forma como ensinamos, os testes serão muito fáceis e todos os estudantes serão aprovados.
Ora, se os conteúdos que ensinamos são fáceis e pouco complexos, nossos estudantes não deverão ser submetidos a conteúdos mais complexos e difíceis do que aqueles que foram ensinados. Solicitar mais do estudante do que aquilo que fora efetivamente ensinado servirá exclusivamente para apostar em que sejam reprovados. Desse modo, os instrumentos devem elaborados em compatibilidade com o ensinado e o aprendido.
Então minimamente, na elaboração de qualquer instrumento de coleta de dados para avaliação da aprendizagem, os instrumentos necessitam ser elaborados, tendo presente as seguintes características:

(a) sistematicidade, isto é, cobrindo todos os conteúdos ensinados, nem mais nem menos que isso;
(b) linguagem compreensível --- as perguntas e proposições de atividades necessitam ser plenamente compreendidas pelos estudantes, desde que deverão manifestar seu desempenho em relação ao que se lhes pede; caso não compreendam aquilo que se lhes pede, como poderão manifestar um desempenho satisfatório? Só se pode responder adequadamente uma pergunta bem compreendida, da mesma forma que se pode realizar uma tarefa desde que ela seja compreendida;
(c) compatibilidade entre ensinado e aprendido, em termos de conteúdos, níveis de dificuldade e de complexidade dos conteúdos trabalhados; nem mais fácil nem mais difícil;
(d) precisão naquilo que se pergunta ou naquilo que se pede como tarefa (professor e estudante necessitam ter a mesma compreensão da mesma pergunta ou da mesma tarefa a ser realizada; perguntas imprecisas poderão receber respostas inesperadas; tarefas definidas imprecisamente não poderão ser realizadas com precisão).

Assim sendo, os professores, ao elaborar instrumentos de coleta de dados para a avaliação da aprendizagem dos seus estudantes, minimamente, deverão ter presentes as quatro caraterísticas, acima indicadas, ou seja, manter perguntas e tarefas comprometidas com aquilo que fora efetivamente ensinado e efetivamente aprendido em sala de aula.
Vale ainda uma observação: a fim de que os estudantes aprendam efetivamente, há a condição de que o ensino seja ativo, desde que o cérebro humano, centro administrativo de nossas vidas, constrói os conhecimentos e as habilidades de modo ativo. Não existe possibilidade de uma aprendizagem significativa se dar de forma mental e neurologicamente passiva por parte do estudante. Aquilo que denominamos, cotidianamente, de aprendizagem “de memória”, usualmente, é esquecida no momento subsequente, devido não estar estruturada em um algoritmo neurológico de memória; e este só é construído de modo ativo. Todavia, para que a aprendizagem se dê ativamente, o educador necessita de investir nessa modalidade de ensinar e aprender.
Ensinar ativamente, implica em (a) expor um conteúdo (seja de forma oral, seja através de livros didáticos, de textos, de dicionários...); (b) auxiliar o estudante na compreensão daquilo que fora exposto; (c) possibilitar aos estudantes exercitar os conteúdos expostos; (d) possibilitar aos estudantes as possibilidades de aplicação do aprendido --- isso alarga o campo do conhecimento; (e) produzir sínteses do aprendido; (f) mais longe um pouco, recriar o aprendido.
A avaliação, usada diagnosticamente, auxilia o educador a saber se seu estudante aprendeu, ou não, determinada compreensão da realidade ou de determinada habilidade. Se não adquiriu, seja a compreensão ou a habilidade, e o educador deseja que ele adquira, investirá mais e mais, até que essas condutas se tornem do próprio estudante.
Condutas aprendidas transforma-se em algoritmos neurológicos permanentes. Por isso, disponíveis na memória subconsciente do estudante. Quando necessário, poderá acessá-la e servir-se dela.
Nesse contexto, a investigação avaliativa, por si, não resolve nada. Ela simplesmente revela ao gestor que sua ação já atingiu o resultado desejado, ou que ainda não atingiu essa qualidade. Caso o gestor efetivamente tenha desejo de obter esse determinado resultado, deverá decidir investir mais e mais em sua busca.
Quem produz resultado é a gestão de uma ação, não a avaliação. A avaliação revela a qualidade da realidade, por isso, é parceira do gestor, tendo em vista sinalizar-lhe a qualidade já obtida com sua ação. Então, poderá decidir se encerra sua busca de maior satisfatoriedade, desde que já atingiu, ou se investe mais, desde que ainda não está satisfeito com o resultado já obtido.
Então, pode-se compreender que o uso diagnóstico dos resultados da avaliação subsidia o gestor a construir um resultado que possa ser classificado como satisfatório.
Para o gestor de uma atividade, só existe uma possibilidade: produzir um resultado que possa ser classificado como satisfatório. As outras qualidades, inferiores ao nível de satisfatoriedade, não podem e não devem ser objeto de desejo de um profissional. Tem do em vista evitar essa possibilidade, há que se ter habilidades suficientes para a ação específica para ensinar e desejo de se obter o mais satisfatório dos resultados.
Nesse sentido, de modo epistemologicamente adequado, o uso classificatório dos resultados da avaliação tem a função de indicar ao gestor o nível de satisfatoriedade a ser efetivamente obtido. No caso da sala de aula, todos os estudantes devem atingir esse nível; portanto, o educador, como gestor da sala de aula, deve investir para que todos atinjam esse nível de satisfatoriedade, o que significa todos serem classificados nesse nível.
Para tanto, o uso diagnóstico dos resultados da avaliação será nosso parceiro, sinalizando-nos se os resultados de nossa ação já atingiram o nível de satisfatoriedade ou se, desejando esse nível de resultado, devemos investir mais e mais para obtê-lo.


3.2. Avaliação institucional

No cotidiano educativo, via o senso comum social, se pensa que o único responsável pelo fracasso escolar é o estudante. As frases mais comuns são: “No meu tempo, não era dessa forma. Tudo era mais difícil”. “Os estudantes, agora, só querem moleza”. “Ninguém mais quer estudar a sério. Agora são somente os jogos eletrônicos”. E.... por aí se vai.
As ações educativas escolares são praticadas dentro de uma instituição chamada escola, que agrega um conjunto de profissionais, organizados para cumprir suas tarefas sociais, cujo objetivo final, nos níveis de escolaridade, infantil, ensino fundamental e médio, é o ensino e a aprendizagem; no nível superior, além do ensino, inclui-se as tarefas de pesquisa e extensão universitária.
Os inícios dos investimentos numa prática de avaliação institucional em educação, em nosso país, ocorreram pós a implantação da Reforma Universitária, no Brasil. PARU – Programa de Avaliação da Reforma Universitário --- é doa no de 1983, e o PAIUB – Programa de Avaliação Institucional da Universidade Brasileira --- é 1994. E, o exercício de avaliar os outros níveis de ensino chegou até nós com as proposições da avaliação de larga escala, da qual tratamos no próximo tópico deste texto.
Como diz o ditado popular “pelos frutos, conhecereis a árvore”, no caso da instituição escolar, esse ditado se traduz da seguinte forma: “Pelos resultados relativos aos seus objetivos, se conhecerá a qualidade da instituição”. Então, para proceder a avaliação institucional, o primeiro dado a ser coletado refere-se aos resultados produzidos por essa determinada escola no que se refere aos seus objetivos específicos. Portanto, em primeiro lugar, haverá que se ter consciência do produto da escola, em termos de aprendizagem por parte dos estudantes, segundo o currículo estabelecido. Essa é sua atividade-fim, como também seu resultado-fim.
Enquanto no âmbito da avaliação da aprendizagem, importa verificar o desempenho individual de cada estudante, aqui importa ter presente o desempenho coletivo dos estudantes, representando o desempenho da instituição, ou seja, entre “X” estudantes matriculados na educação infantil, quantos deles efetivamente aprenderam aquilo que deveriam aprender; o mesmo ocorrendo no que se refere às séries e turmas do ensino fundamental, como também do médio. O desempenho na aprendizagem dos estudantes, decorrente do investimento no ensino, será o parâmetro fundamental para atribuir qualidade a uma instituição escolar.
Subsequentemente a essa variável --- desempenho dos estudantes em suas aprendizagens, em conformidade com o currículo estabelecido ---, no processo de avaliação de uma instituição escolar, importará levar em conta os fatores que sustentam a vida da instituição. Sua estrutura e organização sustentam resultados positivos frente à sua atividade-fim?
Para se ter ciência das qualidades da instituição para atender aos seus objetivos, importa levar em conta: (a) as condições de pessoal a serviço dos objetivos dessa instituição, em termos de atendimento de suas necessidades institucionais (quantidade e qualidade), (b) a dinâmica administrativa da instituição como um todo e do pessoal a seu serviço, (c) a satisfatoriedade do espaço físico (quantidade de qualidade), (d) a disponibilidades dos recursos técnicos e financeiros necessários para que essa instituição possa cumprir os seus objetivos. Enfim, frente aos resultados-fins da instituição --- a aprendizagem dos estudantes ---, importa verificar a disponibilidade e a qualidade dos seus recursos alocados e disponíveis para que a instituição efetivamente possa cumprir os seus objetivos.
Então, aqui, novamente, a avaliação será a parceira dos gestores da instituição, revelando-lhe as forças e as fragilidades de sua atuação, possibilitando, se se desejar, as correções necessárias.
Também aqui, importa ter presente os dois usos dos resultados da avaliação, anteriormente assinalados, o uso diagnóstico, que subsidia as decisões do staf administrativo da instituição, frente aos seus objetivos, e, o uso classificatório, equivalente ao padrão desejado de qualidade da instituição. O uso classificatório dos resultados da avaliação, como assinalamos anteriormente, expressa, em termos de qualidade, a meta a ser atingida pela instituição. Os resultados da avaliação classificam a instituição em que situação de satisfatoriedade?
Esse diagnóstico subsidiará os gestores da instituição na busca da satisfatoriedade de sua instituição frente aos objetos colimados. Todas as instituições, inclusive a educativa não poderá sobreviver satisfatoriamente, sem uma avaliação permanente de sua estrutura, organização e funcionamento.

3.3. Avaliação de larga escala

À semelhança da avaliação institucional, a avaliação de larga escala em educação atua sobre o coletivo e não mais sobre cada estudante individualmente, nem atua diretamente sobre cada instituição em si, mas sobre o sistema de ensino, tomado em seus diversos segmentos, escola, município, estado, federação.
Haverá, sim, necessidade de que cada estudante expresse sua aprendizagem individual, não para ser aprovado ou reprovado individualmente, mas, no caso, para subsidiar uma leitura estatística dos resultados obtidos pelo sistema de ensino composto por instituições (escolas), assim como por estruturas político-administrativas, como municípios, estados, federação. De fato, a avaliação de larga escola em educação, se inicia na turma de estudantes, acompanhada por um professor, quando tomada como a menor unidade do sistema de ensino, e se estende pelo país como um todo.
Quantos estudantes desta turma aprenderam aquilo que deveriam ter aprendido? A seguir, quantos estudantes de todas as turmas da 1ª série aprenderam os conteúdos ensinados em matemática, em língua portuguesa, em geografia...? O mesmo correndo em todas as outras séries administradas pela instituição.
A seguir, quantos estudantes desta escola lograram aprendizagem satisfatória? A seguir, neste município, como está o desempenho de aprendizagem dos estudantes relativos aos variados níveis e séries de escolaridade? Nesse estado da federação, como está o desempenho dos estudantes, por séries, turmas, níveis de escolaridade?
No país como um todo, como se encontra o desempenho dos estudantes em termos de sua aprendizagem, compatível com os currículos estabelecidos para cada nível de escolaridade?
Como se encontram os componentes do sistema de ensino --- escolas, municípios, estados e federação ---, tendo em vista garantir condições de efetividade no ensino?
Essas perguntas cabem no que se refere aos diversos níveis de escolaridade --- educação infantil, ensino fundamental, ensino médio, ensino superior; afinal, uma leitura estatística do desempenho do sistema educativo no que se refere ao seu objetivo fundamental que é ensinar, cuja consequência deve ser a aprendizagem satisfatória de todos os estudantes.
A avaliação de larga escala tem por objetivo subsidiar decisões dos gestores do sistema de ensino, tendo em vista garantir a qualidade desejada dos resultados dos processos educativos em termos estatísticos, relativos às diversas instâncias político-administrativas do país. A avaliação de larga escala subsidia todas as instâncias do ensino no país, a fim de que cada uma delas se autoanalise e busque condições de melhor atende seus objetivos-fins.
No Brasil, desde o final dos anos 1980, vem se buscando a implantação de um sistema nacional de avaliação da educação, que hoje, se compõe de múltiplos investimentos, entre outros, no nível Federal: SABEB, Prova Brasil, Provinha Brasil, ANA, ENEM, ENAD, IDEB. Muitos estados e municípios do país estabeleceram também seus respectivos sistemas de avaliação. E há o sistema internacional de avaliação em educação realizada pela Projeto PISA - Programme for International Student Assessment (Programa Internacional de Avaliação de Estudantes), a partir do ano 2000, realizado pela OCDE - Organização para a Cooperação e Desenvolvimento Econômico, que realiza uma avaliação da educação em um conjunto de países, participantes da organização e outros que são convidados. O Brasil integra o Projeto Pisa, desde seu início.

A avaliação de larga escala, como já afirmamos, subsidia gestores de educação, nos variados níveis da organização social e política do país a tomar decisões necessárias, tendo em vista a melhoria do sistema de ensino como um todo.









______________________________________________________