Speech: Trim some surplus length off data structures. Now use less than 2k of heap.

markshannon · markshannon · commit a0a9eaab8d27 · 2016-07-17T09:52:28.000-07:00
diff --git a/source/lib/sam/reciter.c b/source/lib/sam/reciter.c
@@ -73,17 +73,15 @@ int TextToPhonemes(reciter_memory* mem) // Code36484
 		mem->inputtemp[X] = A;
 		X++;
 		Y++;
-	} while (Y != 255);
+	} while (Y != INPUT_PHONEMES-1);
 
-
-	X = 255;
-	mem->inputtemp[X] = 27;
-	mem61 = 255;
+	mem->inputtemp[INPUT_PHONEMES-1] = 27;
+	mem61 = 255; // -1
 
 
 pos36550:
 	A = 255;
-	mem56 = 255;
+	mem56 = 255; // -1
 
 
 pos36554:
diff --git a/source/lib/sam/reciter.h b/source/lib/sam/reciter.h
@@ -4,8 +4,8 @@
 //int TextToPhonemes(char *input, char *output);
 
 typedef struct _reciter_memory {
-    char input[256];
-    unsigned char inputtemp[256];   // secure copy of input tab36096
+    char input[128];
+    unsigned char inputtemp[128];   // secure copy of input tab36096
 } reciter_memory;
 
 int TextToPhonemes(reciter_memory *mem);
diff --git a/source/lib/sam/render.c b/source/lib/sam/render.c
@@ -404,7 +404,7 @@ do
 		phase2--;
 	} while(phase2 != 0);
 	mem44++;
-} while(mem44 != 0);
+} while(mem44 != RENDER_FRAMES);
 
 
 // -------------------
@@ -708,7 +708,7 @@ do
 	if (!sam->common.singmode)
 	{
         // iterate through the buffer
-		for(i=0; i<256; i++) {
+		for(i=0; i<RENDER_FRAMES; i++) {
             // subtract half the frequency of the formant 1.
             // this adds variety to the voice
     		sam->render.pitch[i] -= (sam->render.freq_amp[i].freq1 >> 1);
@@ -727,7 +727,7 @@ do
 //
 
 	//amplitude rescaling
-	for(i=255; i>=0; i--)
+	for(i=RENDER_FRAMES-1; i>=0; i--)
 	{
 		sam->render.freq_amp[i].amp1 = amplitudeRescale[sam->render.freq_amp[i].amp1];
 		sam->render.freq_amp[i].amp2 = amplitudeRescale[sam->render.freq_amp[i].amp2];
@@ -742,7 +742,7 @@ do
 
 if (debug)
 {
-	PrintOutput(sam->render.flags, sam->render.freq_amp, sam->render.pitch);
+	PrintOutput(sam->render.flags, sam->render.freq_amp, sam->render.pitch, mem48);
 }
 
 // PROCESS THE FRAMES
diff --git a/source/lib/sam/sam.c b/source/lib/sam/sam.c
@@ -6,7 +6,6 @@
 #include "render.h"
 #include "SamTabs.h"
 
-//standard sam sound
 extern int debug;
 
 const unsigned char mem59=0;
@@ -19,11 +18,8 @@ int bufferpos=0;
 
 void SetInput(sam_memory* sam, const char *_input, unsigned int l)
 {
-	int i;
-	if (l > 254) l = 254;
-	for(i=0; i<l; i++)
-		sam->prepare.input[i] = _input[i];
-	sam->prepare.input[l] = 0;
+    sam->prepare.input = _input;
+    sam->prepare.input_length = l;
 }
 
 void Init(sam_memory* sam);
@@ -76,19 +72,19 @@ void Init(sam_memory* sam)
 	ampl3data = &mem[45456];
 	*/
 
-	for(i=0; i<256; i++)
+	for(i=0; i<INPUT_PHONEMES; i++)
 	{
 		sam->prepare.phoneme_input[i].stress = 0;
 		sam->prepare.phoneme_input[i].length = 0;
 	}
 	
-	for(i=0; i<60; i++)
+	for(i=0; i<OUTPUT_PHONEMES; i++)
 	{
 		sam->common.phoneme_output[i].index = 0;
 		sam->common.phoneme_output[i].stress = 0;
 		sam->common.phoneme_output[i].length = 0;
 	}
-	sam->prepare.phoneme_input[255].index = PHONEME_END; //to prevent buffer overflow // ML : changed from 32 to 255 to stop freezing with long inputs
+	sam->prepare.phoneme_input[INPUT_PHONEMES-1].index = PHONEME_END; //to prevent buffer overflow // ML : changed from 32 to 255 to stop freezing with long inputs
 
 }
 
@@ -194,9 +190,9 @@ void InsertBreath(sam_memory* sam)
 		if (index == PHONEME_END) return;
 		mem55 += sam->prepare.phoneme_input[X].length;
 
-		if (mem55 < 232)
+		if (mem55 < RENDER_FRAMES-24)
 		{
-			if (index != 254) // ML : Prevents an index out of bounds problem		
+			if (index != PHONEME_END_BREATH) // ML : Prevents an index out of bounds problem
 			{
 				A = flags2[index]&1;
 				if(A != 0)
@@ -287,11 +283,9 @@ void CopyStress(sam_memory* sam)
 void Insert(sam_memory* sam, unsigned char position/*var57*/, unsigned char index, unsigned char length, unsigned char stress)
 {
 	int i;
-	for(i=253; i >= position; i--) // ML : always keep last safe-guarding 255	
+	for(i=INPUT_PHONEMES-3; i >= position; i--) // ML : always keep last safe-guarding.
 	{
-		sam->prepare.phoneme_input[i+1].index = sam->prepare.phoneme_input[i].index;
-		sam->prepare.phoneme_input[i+1].length = sam->prepare.phoneme_input[i].length;
-		sam->prepare.phoneme_input[i+1].stress = sam->prepare.phoneme_input[i].stress;
+        sam->prepare.phoneme_input[i] = sam->prepare.phoneme_input[i];
 	}
 
 	sam->prepare.phoneme_input[position].index = index;
@@ -362,27 +356,38 @@ int Parser1(sam_memory* sam)
 	Y = 0;
 	
 	// CLEAR THE STRESS TABLE
-	for(i=0; i<256; i++)
+	for(i=0; i<INPUT_PHONEMES; i++)
 		sam->prepare.phoneme_input[i].stress = 0;
 
   // THIS CODE MATCHES THE PHONEME LETTERS TO THE TABLE
 	// pos41078:
 	while(1)
 	{
-        // GET THE FIRST CHARACTER FROM THE PHONEME BUFFER
-		sign1 = sam->prepare.input[X];
-		// TEST FOR 0 -- END OF STRING MARKER
-		if (sign1 == 0)
+        if (position >= INPUT_PHONEMES) {
+            // Run out of space for phonemes -- This won't happen with a string from the reciter,
+            // but can happen with manually created phonetic input.
+            return 0;
+        }
+		// TEST FOR END OF STRING
+		if (X >= sam->prepare.input_length)
 		{
            // MARK ENDPOINT AND RETURN
 			sam->prepare.phoneme_input[position].index = PHONEME_END;      //mark endpoint
 			// REACHED END OF PHONEMES, SO EXIT
 			return 1;       //all ok
 		}
-		
+
+        // GET THE FIRST CHARACTER FROM THE PHONEME BUFFER
+        sign1 = sam->prepare.input[X];
+
 		// GET THE NEXT CHARACTER FROM THE BUFFER
 		X++;
-		sign2 = sam->prepare.input[X];
+        if (X == sam->prepare.input_length)
+        {
+            sign2 = 0;
+        } else {
+            sign2 = sam->prepare.input[X];
+        }
 		
 		// NOW sign1 = FIRST CHARACTER OF PHONEME, AND sign2 = SECOND CHARACTER OF PHONEME
 
diff --git a/source/lib/sam/sam.h b/source/lib/sam/sam.h
@@ -19,18 +19,25 @@ enum {
     PHONEME_END_BREATH=126
 };
 
+#define RENDER_FRAMES 224
+
+#define INPUT_PHONEMES 128
+#define OUTPUT_PHONEMES (RENDER_FRAMES/4)
+
 typedef struct _prepare_memory {
-    char input[256];
-    phoneme_t phoneme_input[256];
+    const char *input;
+    unsigned int input_length;
+    phoneme_t phoneme_input[INPUT_PHONEMES];
 } prepare_memory;
 
+
 typedef struct _common_memory {
     unsigned char speed;
     unsigned char pitch;
     unsigned char mouth;
     unsigned char throat;
     int singmode;
-    phoneme_t phoneme_output[60];
+    phoneme_t phoneme_output[OUTPUT_PHONEMES];
 } common_memory;
 
 typedef struct _render_freq_amp_t {
@@ -43,9 +50,9 @@ typedef struct _render_freq_amp_t {
 } render_freq_amp_t;
 
 typedef struct _render_memory {
-    render_freq_amp_t freq_amp[256];
-    unsigned char pitch[256];
-    unsigned char flags[256];
+    render_freq_amp_t freq_amp[RENDER_FRAMES];
+    unsigned char pitch[RENDER_FRAMES];
+    unsigned char flags[RENDER_FRAMES];
 } render_memory;
 
 typedef struct _sam_memory {
diff --git a/source/microbit/modspeech.c b/source/microbit/modspeech.c
@@ -115,7 +115,9 @@ static mp_obj_t make_speech_iter(void) {
 static mp_obj_t pronounce(mp_obj_t words) {
     mp_uint_t len, outlen;
     const char *txt = mp_obj_str_get_data(words, &len);
-    if (len > 254) {
+    // Reciter truncates *output* at about 120 characters.
+    // So to avoid that we must disallow any input that will exceed that.
+    if (len > 80) {
         nlr_raise(mp_obj_new_exception_msg(&mp_type_ValueError, "text too long."));
     }
     reciter_memory *mem = m_new(reciter_memory, 1);
@@ -139,6 +141,8 @@ static mp_obj_t pronounce(mp_obj_t words) {
     return res;
 }MP_DEFINE_CONST_FUN_OBJ_1(pronounce_obj, pronounce);
 
+extern int debug;
+
 static mp_obj_t say(mp_uint_t n_args, const mp_obj_t *pos_args, mp_map_t *kw_args) {
 
     static const mp_arg_t allowed_args[] = {
@@ -147,6 +151,7 @@ static mp_obj_t say(mp_uint_t n_args, const mp_obj_t *pos_args, mp_map_t *kw_arg
         { MP_QSTR_speed,    MP_ARG_KW_ONLY | MP_ARG_INT, {.u_int = DEFAULT_SPEED} },
         { MP_QSTR_mouth,    MP_ARG_KW_ONLY | MP_ARG_INT, {.u_int = DEFAULT_MOUTH} },
         { MP_QSTR_throat,   MP_ARG_KW_ONLY | MP_ARG_INT, {.u_int = DEFAULT_THROAT} },
+        { MP_QSTR_debug,   MP_ARG_KW_ONLY | MP_ARG_BOOL, {.u_bool = false} },
     };
 
     // parse args
@@ -162,6 +167,7 @@ static mp_obj_t say(mp_uint_t n_args, const mp_obj_t *pos_args, mp_map_t *kw_arg
     sam->common.speed  = args[2].u_int;
     sam->common.mouth  = args[3].u_int;
     sam->common.throat = args[4].u_int;
+    debug = args[5].u_bool;
 
     mp_uint_t len;
     const char *input = mp_obj_str_get_data(pos_args[0], &len);