Bible Ngram

For this exercise I have taken a txt file of the “original” spanish version of the bible, not the complete bible, I grabbed a chunk of 340,799 words including book titles.

When I say original, I mean it is supposed to be the mos ancient (modern version in doc at the beginning) of the bible.

I used this text before, for an installation made in Colombia (my home). The installation consisted on processing of the text, that is.. counting occurrence of the words, correlating them to the book of the bible where they where in and making a “random” algorithm to select a color to highlight the word. It was projected as a reflection, so you would have to see it using a big mirror in order to read the text on the “normal direction”. The concept of reinterpretation of text by means of color, and having to stand in the middle to read it and be embedded in it while you read, questioned the concept of reading and interpreting this very special book in a number of ways that ultimately was up to you , if you where willing, and not by a third person which is the usual scenario for this very historic important text.

The text is numbered, like this:
Génesis 1
1EN el principio crió Dios los cielos y la tierra.
2Y la tierra estaba desordenada y vacía, y las tinieblas estaban sobre la haz del abismo, y el Espíritu de Dios se movía sobre la haz de las aguas.
3Y dijo Dios: Sea la luz: y fué la luz.

So I decided not to take this out of the text, since it is an important for the way the phrases are formed.
Since it is a learning process based on probability of word appearance in relation to other words, I think that the text being in Spanish does not matter.

I did not write a new code for this, I used the one Heather provided : GenerateNgramText.java
I am a little bit confused on how we were supposed to write a new program. I will ask for directions later on. :S

started with 2-grams 10 words:
de Cisón , oh Jehová nuestro Dios . Levítico 27 1Y HABLO

2-grams 50 words:
hendidura de ellos te ha dado á los cielos , ni su carne . 11Y como David : Si proferirá el tabernáculo , y murió . 22Y Jehová dijo : y reinó en su prójimo : ¿ Quién es tu nombre Jacob : ¡ Quién nos has de ti , y vosotros

3-grams 50 words:
metido en la casa de su madre fué Amutal hija de Aja , concubina de Caleb , le dijo : ¿ Qué te propones con todas mis fuerzas he preparado para mis esquiladores , y vino Aarón y sus aldeas , y Malchías , y á la palabra que Jehová le dió voces

4-gram 50 words:
dormirá , mas no lo echaron . 14Y los hijos de Israel , diciendo : ¿ No eres tú Asael ? Y él respondía : Tu siervo Ben – adad rey de Siria , y á sus hijos , y á todos los pueblos , Atribuid á Jehová gloria y potencia . 29Tributad á

5-gram 50 words:
habían procurado meter mano en el rey Assuero . 22Mas entendido que fué esto por Mardochêo , él lo denunció á la reina Esther : En Susán , capital del reino , 3En el tercer año de Asa rey de Judá , en Beth – semes , y sale á la mar desde el territorio

8-gram 50 words:
harás pascua á Jehová tu Dios : porque en el mes de Abib te sacó Jehová tu Dios de Egipto de noche . 2Y sacrificarás la pascua á Jehová tu Dios , de las ovejas y de las vacas , para sacrificarlas á Jehová tu Dios ; pero lo demás lo destruimos . 16Entonces dijo Samuel á Saúl

12-gram 50 words: it broke: Exception in thread “main” java.lang.OutOfMemoryError: Java heap space

10-gram 50 words:
las fuentes , y el arroyo que derrama por en medio del territorio , diciendo : ¿ Por qué han de hallar los reyes de Asiria muchas aguas cuando vinieren ? 5Alentóse así Ezechîas , y edificó todos los muros caídos , é hizo alzar las torres , y otro muro por de fuera : fortificó además á Millo en

This last test, reads and feels very much like a piece coming from this bible. It feels like it is narrating a story, that has meaning unlike the other tests.

It might help that this text is almost all written in a second persons tense which I feel it is helping the result feel more biblical like. But bottom line… on a 10 gram, feels very much like a well formed biblical text story. 8-O.

————

3 gram with 150 words:

padres . 21De suerte que vistió Salomón de matar al Filisteo , y á sus estancias . 13Además sacudí mi vestido y mi hijo es el que se habían purificado á una fuente de Harod : y todos los que habitaban en Ophel hasta enfrente de Gabaa hacia donde nace el pan de su boca , y en el desierto , y de Judá , por cuanto había ofrecido voluntariamente á Jehová , y á sus hijos y sus hijos , diciendo : 2Habla á los Levitas , y en todo el pueblo , y los de Israel en Thirsa , bebiendo y embriagado en casa de mi padre David supiese nada : mas el templo de Jehová tu Dios , y al pueblo . Ester 10 1Y JEHOVA habló á Moisés : ¿ A cuál de todos tus enemigos , y para el holocausto y presente ; 80Una cuchara de oro puro

this last test, with more words… it did generate a couple of well formed… half phrases.. but it still does not generate the “feeling” of a story that is being narrated logically.

12 Gram 50 words:

y esparció la otra mitad de la sangre sobre el altar . 7Y tomó el libro de la alianza , y leyó á oídos del pueblo , el cual dijo : Haremos todas las cosas que Jehová ha dicho , y obedeceremos . 8Entonces Moisés tomó la sangre , y roció sobre el pueblo , y dijo : He aquí la sangre

THIS DOES MAKES A LOT OF SENSE!!! IT IS A LOGICAL DEVELOPING NARRATION ABOUT A BOUT AN UNDERSTANDABLE SUBJECT!!! ;)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s