===================== BUGS y problemas varios =========================================== * con los locales a "C" (en la consola y en el codigo) puede trabajar sobre ASCII 8 bits, en teoria, pero en la practica da problemas pues: - sin feedback -> indexa y busca bien, pero tiene problemas con algunos caracteres como la u tildada, pues en el 'bsdict' usa dicho caracter como seperador de campos - con feedback -> el parser del feedback no traga los caracteres extendidos * en /prise_tools/src/lib/weights/weights.c -> index_weight() - +-248 : la llamada debe ser a dwf9() * en /prise_index/src/bin/rebuid.tmm/rebuild.tmm.c -> index_weight() - +- 434 : tmpweight = index_weight(coll->options->weightflag, df_i, tf_ij, lengths[docno], docno, 240, 240, avg_df_i); Los parametros 'docno, 240, 240' estan mal . docno: debe ser el numero de documentos en la coleccion, no 'docno', que es el identificador del documento (aunque tampoco hay mayor problema pues no se usa) 240 (1o): es la longitud media del documento habiendo eliminado las stopwords. Se ha puesto a pelo sin haberlo calculado dentro del programa. Se puede calcular (previa "indexacion de prueba") mediante el fichero 'docstats'. 240 (2o): ¿¿?? * segmentation fault al indexar Lo del segmentation fault en el zprise si puede ser por: 1- mala compiliación 2- formato erroneo de las consultas, como tú dices (lo cierto es que el batcprise no es que sea justamente una maravilla de estabilidad) 3- puede ser que, atencion...., la lista de palabras de parada no le guste!!!. Esto es cierto, uno de los errores más frecuentes que hace petar al batchprise es la lista de palabras de parada. Prueba a lanzarlo con una lista de palabras vacias trivial 4- Esté mal indexada la colección. Comprueba al menos estos archivos: - dictionary, con información referente al vocabulario de indexación - docnos, la lista de los 'id' de los documentos indexados - postings. Este es un archivo binario, que debe tener un tamaño bastante grande. Si tienes algún archivo con tamaño cero, desconfia, que algo pasa.