1. సెంటిమెంట్ విశ్లేషణ కోసం ప్రోగ్రామింగ్ బిగ్ డేటాడేటా సైన్స్యూసింగ్ AI

జాన్ పాల్ ముల్లెర్, లూకా ముల్లెర్

సెంటిమెంట్ విశ్లేషణ గణన ప్రకారం వ్రాతపూర్వక వచనం నుండి రచయిత యొక్క వైఖరిని (సానుకూలంగా, ప్రతికూలంగా లేదా తటస్థంగా) ఉపయోగించి, టెక్స్ట్ అంశంపై ఉద్భవించింది. ఈ రకమైన విశ్లేషణ మార్కెటింగ్ మరియు కమ్యూనికేషన్‌లో పనిచేసే వ్యక్తులకు ఉపయోగకరంగా ఉంటుందని రుజువు చేస్తుంది ఎందుకంటే ఇది కస్టమర్లు మరియు వినియోగదారులు ఒక ఉత్పత్తి లేదా సేవ గురించి ఏమనుకుంటున్నారో అర్థం చేసుకోవడానికి సహాయపడుతుంది మరియు అందువల్ల తగిన విధంగా వ్యవహరించండి (ఉదాహరణకు, సంతృప్తి చెందని కస్టమర్లను తిరిగి పొందడానికి ప్రయత్నించడం లేదా వేరే అమ్మకపు వ్యూహాన్ని ఉపయోగించాలని నిర్ణయించుకోవడం ). అందరూ సెంటిమెంట్ విశ్లేషణ చేస్తారు. ఉదాహరణకు, వచనాన్ని చదివేటప్పుడు, ప్రజలు సహజంగానే దానిని వ్రాసిన వ్యక్తిని కదిలించే భావాన్ని గుర్తించడానికి ప్రయత్నిస్తారు. ఏదేమైనా, చదవడానికి మరియు అర్థం చేసుకోవడానికి పాఠాల సంఖ్య చాలా పెద్దది అయినప్పుడు మరియు టెక్స్ట్ నిరంతరం పేరుకుపోయినప్పుడు, సోషల్ మీడియా మరియు కస్టమర్ ఇ-మెయిల్స్‌లో వలె, సెంటిమెంట్ విశ్లేషణను ఆటోమేట్ చేయడం ముఖ్యం.

AI సెంటిమెంట్ విశ్లేషణ

రాబోయే ఉదాహరణ కేరాస్ మరియు టెన్సార్‌ఫ్లో ఉపయోగించి RNN ల యొక్క టెస్ట్ రన్, ఇది చలన చిత్ర సమీక్షలో వ్యక్తీకరించిన వైఖరిని వర్గీకరించగల సెంటిమెంట్ అనాలిసిస్ అల్గోరిథంను నిర్మిస్తుంది. డేటా IMDb డేటాసెట్ యొక్క నమూనా, ఇది 50,000 సమీక్షలను కలిగి ఉంటుంది (రైలు మరియు పరీక్షా సెట్ల మధ్య సగానికి విభజించబడింది) సమీక్ష యొక్క మనోభావాన్ని వ్యక్తపరిచే లేబుల్‌తో పాటు (0 = ప్రతికూల, 1 = పాజిటివ్). IMDb అనేది సినిమాలు, టీవీ సిరీస్ మరియు వీడియో గేమ్‌ల గురించి సమాచారాన్ని కలిగి ఉన్న పెద్ద ఆన్‌లైన్ డేటాబేస్. వాస్తవానికి అభిమానులచే నిర్వహించబడుతున్నది, దీనిని ఇప్పుడు అమెజాన్ అనుబంధ సంస్థ నడుపుతోంది. IMDb లో, ప్రజలు తమ అభిమాన ప్రదర్శన గురించి అవసరమైన సమాచారాన్ని కనుగొంటారు అలాగే వారి వ్యాఖ్యలను పోస్ట్ చేస్తారు లేదా ఇతర సందర్శకులకు చదవడానికి సమీక్ష రాయండి.

కేరాస్ IMDb డేటా కోసం డౌన్‌లోడ్ చేయగల రేపర్ను అందిస్తుంది. మీరు ఈ డేటాను రైలు మరియు పరీక్షా సమితిలో సిద్ధం చేయండి, షఫుల్ చేయండి మరియు అమర్చండి. ప్రత్యేకించి, కేరాస్ అందించే IMDb వచన డేటా విరామచిహ్నాలను శుభ్రపరుస్తుంది, చిన్న అక్షరాలుగా సాధారణీకరించబడుతుంది మరియు సంఖ్యా విలువలుగా మార్చబడుతుంది. ప్రతి పదం పౌన .పున్యంలో దాని ర్యాంకింగ్‌ను సూచించే సంఖ్యగా కోడ్ చేయబడుతుంది. చాలా తరచుగా పదాలు తక్కువ సంఖ్యలను కలిగి ఉంటాయి; తక్కువ తరచుగా పదాలు అధిక సంఖ్యలను కలిగి ఉంటాయి.

స్టార్టర్ పాయింట్‌గా, కోడ్ కేరాస్ నుండి imdb ఫంక్షన్‌ను దిగుమతి చేస్తుంది మరియు ఇంటర్నెట్ నుండి డేటాను తిరిగి పొందడానికి దాన్ని ఉపయోగిస్తుంది (సుమారు 17.5MB డౌన్‌లోడ్). ఉదాహరణ ఉపయోగించే పారామితులు కేవలం 10,000 పదాలను కలిగి ఉంటాయి మరియు కేరాస్ ఒక నిర్దిష్ట యాదృచ్ఛిక విత్తనాన్ని ఉపయోగించి డేటాను షఫుల్ చేయాలి. (విత్తనాన్ని తెలుసుకోవడం వల్ల షఫుల్‌ను పునరుత్పత్తి చేయడం సాధ్యపడుతుంది.) ఫంక్షన్ రెండు రైలు మరియు పరీక్షా సెట్‌లను తిరిగి ఇస్తుంది, రెండూ టెక్స్ట్ సీక్వెన్స్‌లతో మరియు సెంటిమెంట్ ఫలితం.

keras.datasets నుండి దిగుమతి imdb
top_words = 10000
((x_train, y_train),
(x_test, y_test)) = imdb.load_data (num_words = top_words,
సీడ్ = 21)

మునుపటి కోడ్ పూర్తయిన తర్వాత, మీరు ఈ క్రింది కోడ్‌ను ఉపయోగించి ఉదాహరణల సంఖ్యను తనిఖీ చేయవచ్చు:

ముద్రణ ("శిక్షణ ఉదాహరణలు:% i"% లెన్ (x_train))
ముద్రణ ("పరీక్ష ఉదాహరణలు:% i"% లెన్ (x_test))

న్యూరల్ నెట్‌వర్క్ యొక్క శిక్షణ మరియు పరీక్ష దశలో ఉపయోగం కోసం అందుబాటులో ఉన్న కేసుల సంఖ్య గురించి అడిగిన తరువాత, కోడ్ ప్రతి దశకు 25,000 ఉదాహరణల జవాబును అందిస్తుంది. (ఈ డేటాసెట్ భాషా సమస్యకు చాలా చిన్నది; స్పష్టంగా డేటాసెట్ ప్రధానంగా ప్రదర్శన ప్రయోజనాల కోసం.) అదనంగా, డేటాసెట్ సమతుల్యంగా ఉందో లేదో కోడ్ నిర్ణయిస్తుంది, అంటే దీనికి దాదాపు సమానమైన సానుకూల మరియు ప్రతికూల సెంటిమెంట్ ఉదాహరణలు ఉన్నాయి.

సంఖ్యను np గా దిగుమతి చేయండి
ముద్రణ (np.unique (y_train, return_counts = true))

ఫలితం, శ్రేణి ([12500, 12500]), డేటాసెట్ సానుకూల మరియు ప్రతికూల ఫలితాల మధ్య సమానంగా విభజించబడిందని నిర్ధారిస్తుంది. డేటాసెట్ యొక్క ప్రదర్శనాత్మక స్వభావం కారణంగా ప్రతిస్పందన తరగతుల మధ్య ఇటువంటి సమతుల్యత ప్రత్యేకంగా ఉంటుంది. వాస్తవ ప్రపంచంలో, మీరు సమతుల్య డేటాసెట్లను అరుదుగా కనుగొంటారు. తదుపరి దశ డేటాసెట్‌లో ఉపయోగించిన కోడ్ మరియు నిజమైన పదాల మధ్య మార్చగల కొన్ని పైథాన్ నిఘంటువులను సృష్టిస్తుంది. వాస్తవానికి, ఈ ఉదాహరణలో ఉపయోగించిన డేటాసెట్ ముందే ప్రాసెస్ చేయబడింది మరియు పదాలను సూచించే సంఖ్యల శ్రేణులను అందిస్తుంది, పదాలు కాదు. (కేరాస్‌లో మీరు కనుగొన్న LSTM మరియు GRU అల్గోరిథంలు సంఖ్యల శ్రేణులను సంఖ్యలుగా ఆశించాయి.)

word_to_id = {w: w కోసం i + 3, i imdb.get_word_index () లో. అంశాలు ()}
id_to_word = {0: '', 1: '', 2: ''}
id_to_word.update (w కోసం + i + 3: w, i imdb.get_word_index () లో. అంశాలు ()})
డెఫ్ కన్వర్ట్_టో_టెక్స్ట్ (సీక్వెన్స్):
తిరిగి ''. చేరండి (s> = 3] అయితే క్రమంలో s కోసం [id_to_word [లు])
ప్రింట్ (convert_to_text (x_train [8]))

మునుపటి కోడ్ స్నిప్పెట్ రెండు మార్పిడి నిఘంటువులను (పదాల నుండి సంఖ్యా సంకేతాలకు మరియు దీనికి విరుద్ధంగా) నిర్వచిస్తుంది మరియు డేటాసెట్ ఉదాహరణలను చదవగలిగే వచనంలోకి అనువదిస్తుంది. ఒక ఉదాహరణగా, కోడ్ తొమ్మిదవ ఉదాహరణను ముద్రిస్తుంది: “ఈ చిత్రం చెడ్డ రైలు శిధిలాల మాదిరిగా భయంకరమైనది…”. ఈ సారాంశం నుండి, ఈ సినిమా పట్ల సెంటిమెంట్ సానుకూలంగా లేదని మీరు సులభంగా can హించవచ్చు. చెడు, శిధిలాలు మరియు భయంకరమైన పదాలు బలమైన ప్రతికూల అనుభూతిని తెలియజేస్తాయి మరియు ఇది సరైన మనోభావాన్ని ess హించడం సులభం చేస్తుంది.

ఈ ఉదాహరణలో, మీరు సంఖ్యా సన్నివేశాలను స్వీకరిస్తారు మరియు వాటిని తిరిగి పదాలుగా మారుస్తారు, కానీ దీనికి విరుద్ధం సాధారణం. సాధారణంగా, మీరు పదాలతో రూపొందించిన పదబంధాలను పొందుతారు మరియు వాటిని RNN ల పొరకు తిండికి పూర్ణాంకాల శ్రేణులుగా మారుస్తారు. కేరాస్ ఒక ప్రత్యేకమైన ఫంక్షన్‌ను అందిస్తుంది, టోకనైజర్ ఇది మీ కోసం చేయగలదు. శిక్షణ డేటా నుండి పూర్ణాంకాలకు పదాలను ఎలా మ్యాప్ చేయాలో తెలుసుకోవడానికి మరియు టెక్స్ట్_టో_మాట్రిక్స్, టెక్స్ట్‌ను సీక్వెన్స్గా మార్చడానికి ఇది ఫిట్_ఆన్_టెక్స్ట్ పద్ధతులను ఉపయోగిస్తుంది.

అయినప్పటికీ, ఇతర పదబంధాలలో, సెంటిమెంట్ విశ్లేషణ కోసం మీరు అలాంటి బహిర్గతం చేసే పదాలను కనుగొనలేకపోవచ్చు. భావన మరింత సూక్ష్మంగా లేదా పరోక్షంగా వ్యక్తీకరించబడింది, మరియు వచనంలో ప్రారంభంలో ఉన్న భావాన్ని అర్థం చేసుకోవడం సాధ్యం కాకపోవచ్చు ఎందుకంటే పదబంధాలను మరియు పదాలను బహిర్గతం చేయడం ఉపన్యాసంలో చాలా తరువాత కనిపిస్తుంది. ఈ కారణంగా, మీరు ఎంత పదబంధాన్ని విశ్లేషించాలనుకుంటున్నారో కూడా మీరు నిర్ణయించుకోవాలి.

సాంప్రదాయకంగా, మీరు టెక్స్ట్ యొక్క ప్రారంభ భాగాన్ని తీసుకొని మొత్తం సమీక్షకు ప్రతినిధిగా ఉపయోగిస్తారు. కొన్నిసార్లు మీకు కొన్ని ప్రారంభ పదాలు అవసరం - ఉదాహరణకు మొదటి 50 పదాలు - అర్ధాన్ని పొందడానికి; కొన్నిసార్లు మీకు మరింత అవసరం. ముఖ్యంగా పొడవైన గ్రంథాలు వాటి ధోరణిని ప్రారంభంలో వెల్లడించవు. అందువల్ల మీరు పని చేస్తున్న వచన రకాన్ని అర్థం చేసుకోవడం మరియు లోతైన అభ్యాసాన్ని ఉపయోగించి ఎన్ని పదాలను విశ్లేషించాలో నిర్ణయించడం మీ ఇష్టం. ఈ ఉదాహరణ మొదటి 200 పదాలను మాత్రమే పరిగణిస్తుంది, ఇది సరిపోతుంది.

కోడ్ 3 వ సంఖ్యతో మొదలయ్యే పదాలకు కోడ్ ఇవ్వడం ప్రారంభిస్తుందని మీరు గమనించారు, తద్వారా 0 నుండి 2 వరకు సంకేతాలను వదిలివేస్తారు. పదబంధాన్ని ప్రారంభించడానికి సిగ్నలింగ్ చేయడం, సీక్వెన్స్ స్థిరంగా ఉండటానికి ఖాళీ స్థలాలను నింపడం వంటి ప్రత్యేక ట్యాగ్‌ల కోసం తక్కువ సంఖ్యలు ఉపయోగించబడతాయి. ఒక నిర్దిష్ట పొడవు వద్ద, మరియు మినహాయించబడిన పదాలను గుర్తించడం వలన అవి తగినంత తరచుగా లేవు. ఈ ఉదాహరణ చాలా తరచుగా 10,000 పదాలను మాత్రమే ఎంచుకుంటుంది. ప్రారంభ, ముగింపు మరియు గుర్తించదగిన పరిస్థితులను ఎత్తిచూపడానికి ట్యాగ్‌లను ఉపయోగించడం అనేది RNN లతో పనిచేసే ట్రిక్, ముఖ్యంగా యంత్ర అనువాదం కోసం.

keras.preprocessing.afterence దిగుమతి ప్యాడ్_ పరిణామాల నుండి
max_pad = 200
x_train = ప్యాడ్_ పరిణామాలు (x_train,
maxlen = max_pad)
x_test = ప్యాడ్_ పరిణామాలు (x_test,
maxlen = max_pad)
ముద్రణ (x_train [0])

కేరాస్ నుండి మ్యాక్స్_ప్యాడ్ 200 తో సెట్ చేసిన ప్యాడ్_క్వెన్సెన్స్ ఫంక్షన్‌ను ఉపయోగించడం ద్వారా, కోడ్ ప్రతి సమీక్ష యొక్క మొదటి రెండు వందల పదాలను తీసుకుంటుంది. ఒకవేళ సమీక్షలో రెండు వందల కన్నా తక్కువ పదాలు ఉంటే, అవసరమైన సంఖ్యలో సున్నా విలువలు అవసరమైన సంఖ్యల సంఖ్యను చేరుకోవడానికి శ్రేణికి ముందు ఉంటాయి. సన్నివేశాలను ఒక నిర్దిష్ట పొడవుకు కత్తిరించడం మరియు శూన్యాలను సున్నా విలువలతో నింపడం ఇన్పుట్ పాడింగ్ అని పిలుస్తారు, లోతైన అభ్యాస అల్గోరిథంల వంటి RNN లను ఉపయోగించినప్పుడు ఇది ఒక ముఖ్యమైన ప్రాసెసింగ్ చర్య. ఇప్పుడు కోడ్ నిర్మాణాన్ని రూపొందిస్తుంది:

keras.models నుండి దిగుమతి సీక్వెన్షియల్
keras.layers నుండి ద్వి దిశాత్మక, దట్టమైన, డ్రాపౌట్ దిగుమతి
keras.layers నుండి GlobalMaxPool1D, LSTM ను దిగుమతి చేయండి
keras.layers.embeddings నుండి ఎంబెడ్డింగ్ దిగుమతి
embding_vector_length = 32
మోడల్ = సీక్వెన్షియల్ ()
model.add (పొందుపరచే (top_words,
embedding_vector_length,
input_length = max_pad))
model.add (ద్వి దిశాత్మక (LSTM (64, తిరిగి_ పరిణామాలు = నిజం)))
model.add (GlobalMaxPool1D ())
model.add (దట్టమైన (16, క్రియాశీలత = "రెలు"))
model.add (దట్టమైన (1, క్రియాశీలత = "సిగ్మోయిడ్"))
model.compile (నష్టం = 'binary_crossentropy',
ఆప్టిమైజర్ = 'ఆడమ్,
కొలమానాలు = [ 'ఖచ్చితత్వం'])
ముద్రణ (model.summary ())

మునుపటి కోడ్ స్నిప్పెట్ లోతైన అభ్యాస నమూనా ఆకారాన్ని నిర్వచిస్తుంది, ఇక్కడ ఇది కేరాస్ నుండి సహజ భాషా ప్రాసెసింగ్ కోసం కొన్ని ప్రత్యేకమైన పొరలను ఉపయోగిస్తుంది. వేర్వేరు నాడీ పొరలను ఉపయోగించడం ద్వారా నిర్మాణంతో ఏమి జరుగుతుందో తెలుసుకోవడానికి ఉదాహరణ (మోడల్.సమ్మరీ () ఆదేశం) యొక్క సారాంశం కూడా ఉదాహరణ అవసరం.

మీకు ఎంబెడ్డింగ్ లేయర్ ఉంది, ఇది సంఖ్యా సన్నివేశాలను దట్టమైన పద ఎంబెడ్డింగ్‌గా మారుస్తుంది. ఆ రకమైన వర్డ్ ఎంబెడ్డింగ్ RNN ల పొర ద్వారా నేర్చుకోవడానికి మరింత అనుకూలంగా ఉంటుంది. కేరాస్ ఒక ఎంబెడ్డింగ్ పొరను అందిస్తుంది, ఇది తప్పనిసరిగా నెట్‌వర్క్ యొక్క మొదటి పొరగా ఉండటమే కాకుండా, రెండు పనులను సాధించగలదు:

  • సీక్వెన్స్ ఇన్‌పుట్‌కు ముందుగా శిక్షణ పొందిన వర్డ్ ఎంబెడ్డింగ్ (వర్డ్ 2 వెక్ లేదా గ్లోవ్ వంటివి) వర్తింపజేయడం. మీరు దాని పారామితి బరువులకు ఎంబెడ్డింగ్ కలిగి ఉన్న మాతృకను పాస్ చేయాలి. మొదటి నుండి పదం ఎంబెడ్డింగ్‌ను సృష్టించడం, అది అందుకున్న ఇన్‌పుట్‌ల ఆధారంగా.

ఈ రెండవ సందర్భంలో, పొందుపరచడం తెలుసుకోవాలి:

  • input_dim: డేటా నుండి ఆశించిన పదజాలం యొక్క పరిమాణం output_dim: ఉత్పత్తి చేయబడే ఎంబెడ్డింగ్ స్థలం యొక్క పరిమాణం (కొలతలు అని పిలవబడేవి) input_length: ఆశించే శ్రేణి పరిమాణం

మీరు పారామితులను నిర్ణయించిన తరువాత, శిక్షణ సమయంలో సన్నివేశాలను దట్టమైన మాతృకగా మార్చడానికి ఎంబెడ్డింగ్ మంచి బరువులను కనుగొంటుంది. దట్టమైన మాతృక పరిమాణం శ్రేణుల పొడవు మరియు ఎంబెడ్డింగ్ యొక్క పరిమాణం ద్వారా ఇవ్వబడుతుంది.

మీరు కేరాస్ అందించిన ఎంబెడ్డింగ్ పొరను ఉపయోగిస్తే, ఫంక్షన్ కావలసిన ఎంబెడ్డింగ్ యొక్క పరిమాణం ద్వారా పదజాలం యొక్క పరిమాణం యొక్క బరువు మాతృకను మాత్రమే అందిస్తుంది అని మీరు గుర్తుంచుకోవాలి. ఇది పదాలను మాతృక యొక్క నిలువు వరుసలకు మ్యాప్ చేస్తుంది మరియు తరువాత అందించిన ఉదాహరణలకు మాతృక బరువులను ట్యూన్ చేస్తుంది. ఈ పరిష్కారం, ప్రామాణికం కాని భాషా సమస్యలకు ఆచరణాత్మకమైనది అయినప్పటికీ, ఇంతకుముందు చర్చించిన ఎంబెడ్డింగ్స్ అనే పదానికి సమానమైనది కాదు, ఇవి వేరే విధంగా మరియు మిలియన్ల ఉదాహరణలపై శిక్షణ పొందుతాయి.

ఉదాహరణ ద్వి దిశాత్మక చుట్టను ఉపయోగిస్తుంది - 64 కణాల LSTM పొర. ద్వి దిశాత్మక సాధారణ LSTM పొరను రెట్టింపు చేయడం ద్వారా మారుస్తుంది: మొదటి వైపు, ఇది మీరు అందించే ఇన్‌పుట్‌ల సాధారణ క్రమాన్ని వర్తిస్తుంది; రెండవది, ఇది క్రమం యొక్క రివర్స్ను దాటిపోతుంది. మీరు ఈ విధానాన్ని ఉపయోగిస్తున్నారు, ఎందుకంటే కొన్నిసార్లు మీరు పదాలను డిఫరవర్ఓవర్ ఫిట్టింగ్ క్రమంలో ఉపయోగిస్తారు, మరియు ద్వి దిశాత్మక పొరను నిర్మించడం ఏదైనా పద నమూనాను పట్టుకుంటుంది. కేరాస్ అమలు నిజంగా సూటిగా ఉంటుంది: మీరు దీనిని ద్వి దిశాత్మకంగా అందించాలనుకుంటున్న పొరపై ఒక ఫంక్షన్‌గా వర్తింపజేయండి.

ద్వి దిశాత్మక LSTM తిరిగి వచ్చే సన్నివేశాలకు సెట్ చేయబడింది (return_afteences = true); అంటే, ప్రతి సెల్ కోసం, ఇది క్రమం యొక్క ప్రతి మూలకాన్ని చూసిన తర్వాత అందించిన ఫలితాన్ని అందిస్తుంది. ప్రతి శ్రేణికి ఫలితాలు 200 x 128 యొక్క అవుట్పుట్ మ్యాట్రిక్స్, ఇక్కడ 200 అనేది సీక్వెన్స్ ఎలిమెంట్ల సంఖ్య మరియు 128 అనేది పొరలో ఉపయోగించే LSTM కణాల సంఖ్య. ఈ టెక్నిక్ ప్రతి LSTM సెల్ యొక్క చివరి ఫలితాన్ని తీసుకోకుండా RNN ని నిరోధిస్తుంది. టెక్స్ట్ యొక్క సెంటిమెంట్ గురించి సూచనలు వాస్తవానికి ఎంబెడెడ్ పదాల క్రమంలో ఎక్కడైనా కనిపిస్తాయి.

సంక్షిప్తంగా, ప్రతి సెల్ యొక్క చివరి ఫలితాన్ని తీసుకోకపోవడం చాలా ముఖ్యం, కానీ దాని యొక్క ఉత్తమ ఫలితం. అందువల్ల ప్రతి ఎల్‌ఎస్‌టిఎమ్ సెల్ అందించిన ఫలితాల యొక్క ప్రతి క్రమాన్ని తనిఖీ చేయడానికి మరియు గరిష్ట ఫలితాన్ని మాత్రమే నిలుపుకోవడానికి కోడ్ ఈ క్రింది పొర గ్లోబల్‌మాక్స్పూల్ 1 డిపై ఆధారపడుతుంది. ఉదాహరణ ప్రతి ఎల్‌ఎస్‌టిఎమ్ సెల్ నుండి బలమైన సిగ్నల్‌ను ఎంచుకుంటుందని నిర్ధారించుకోవాలి, ఇది కొన్ని అర్ధవంతమైన సంకేతాలను ఎంచుకోవడానికి దాని శిక్షణ ద్వారా ఆశాజనక ప్రత్యేకతను కలిగి ఉంటుంది.

న్యూరల్ సిగ్నల్స్ ఫిల్టర్ చేసిన తరువాత, ఉదాహరణలో 128 అవుట్‌పుట్‌ల పొర ఉంటుంది, ప్రతి ఎల్‌ఎస్‌టిఎమ్ సెల్‌కు ఒకటి. కోడ్ 16 న్యూరాన్ల వరుస దట్టమైన పొరను ఉపయోగించి రెలూ యాక్టివేషన్‌తో సిగ్నల్స్‌ను తగ్గిస్తుంది మరియు మిళితం చేస్తుంది (తద్వారా సానుకూల సంకేతాలను మాత్రమే గుండా వెళుతుంది). వాస్తుశిల్పం సిగ్మోయిడ్ ఆక్టివేషన్ ఉపయోగించి తుది నోడ్‌తో ముగుస్తుంది, ఇది ఫలితాలను 0–1 పరిధిలోకి పిండుతుంది మరియు వాటిని సంభావ్యతలా చేస్తుంది.

నిర్మాణాన్ని నిర్వచించిన తరువాత, మీరు ఇప్పుడు సెంటిమెంట్ విశ్లేషణ చేయడానికి నెట్‌వర్క్‌కు శిక్షణ ఇవ్వవచ్చు. మూడు యుగాలు (డేటాను నమూనాలను నేర్చుకోవటానికి నెట్‌వర్క్ ద్వారా మూడుసార్లు దాటడం) సరిపోతుంది. ఈ కోడ్ ప్రతిసారీ 256 సమీక్షల బ్యాచ్‌లను ఉపయోగిస్తుంది, ఇది బ్యాక్‌ప్రొపగేషన్ ఉపయోగించి బరువును నవీకరించే ముందు ప్రతిసారీ తగినంత రకాల పదాలు మరియు మనోభావాలను చూడటానికి నెట్‌వర్క్‌ను అనుమతిస్తుంది. చివరగా, కోడ్ ధ్రువీకరణ డేటా అందించిన ఫలితాలపై దృష్టి పెడుతుంది (ఇది శిక్షణ డేటాలో భాగం కాదు). ధ్రువీకరణ డేటా నుండి మంచి ఫలితాన్ని పొందడం అంటే న్యూరల్ నెట్ ఇన్‌పుట్‌ను సరిగ్గా ప్రాసెస్ చేస్తోంది. ప్రతి యుగం ముగిసిన తర్వాత కోడ్ ధ్రువీకరణ డేటాపై నివేదిస్తుంది.

history = model.fit (x_train, y_train,
validation_data = (x_test, y_test),
యుగాలు = 3, బ్యాచ్_సైజ్ = 256)

ఫలితాలను పొందడానికి కొంత సమయం పడుతుంది, కానీ మీరు GPU ఉపయోగిస్తుంటే, మీరు ఒక కప్పు కాఫీ తాగడానికి తీసుకునే సమయంలో ఇది పూర్తవుతుంది. ఈ సమయంలో, మీరు ధృవీకరణ డేటాను ఉపయోగించి, ఫలితాలను విశ్లేషించవచ్చు. (ఫలితాలకు శిక్షణ సమయంలో కోడ్ నివేదించిన వాటికి ఆశ్చర్యాలు లేదా తేడాలు ఉండకూడదు.)

నష్టం, మెట్రిక్ = మోడల్. మూల్యాంకనం (x_test, y_test, verbose = 0)
ముద్రణ ("పరీక్ష ఖచ్చితత్వం:% 0.3f"% మెట్రిక్)

అంతిమ ఖచ్చితత్వం, ఇది లోతైన నాడీ నెట్‌వర్క్ నుండి సరైన సమాధానాల శాతం, దీని విలువ 85—86 శాతం ఉంటుంది. మీ న్యూరల్ నెట్‌వర్క్‌ను నిర్మించేటప్పుడు రాండమైజేషన్ కారణంగా మీరు ప్రయోగాన్ని అమలు చేసిన ప్రతిసారీ ఫలితం కొద్దిగా మారుతుంది. మీరు పనిచేస్తున్న డేటా యొక్క చిన్న పరిమాణాన్ని బట్టి ఇది చాలా సాధారణం. మీరు సరైన అదృష్ట బరువులతో ప్రారంభిస్తే, అటువంటి చిన్న శిక్షణా సమయంలో నేర్చుకోవడం సులభం అవుతుంది.

చివరికి, మీ నెట్‌వర్క్ సెంటిమెంట్ ఎనలైజర్, ఇది సినిమా సమీక్షలో వ్యక్తీకరించిన సెంటిమెంట్‌ను 85 శాతం సమయం గురించి సరిగ్గా can హించగలదు. మరింత శిక్షణ డేటా మరియు మరింత అధునాతన నాడీ నిర్మాణాలను చూస్తే, మీరు మరింత ఆకట్టుకునే ఫలితాలను పొందవచ్చు. మార్కెటింగ్‌లో, టెక్స్ట్ చదవడం మరియు చర్య తీసుకోవలసిన అనేక ప్రక్రియలను ఆటోమేట్ చేయడానికి ఇలాంటి సాధనం ఉపయోగించబడుతుంది. మళ్ళీ, మీరు ఒక న్యూరల్ నెట్‌వర్క్‌తో ఇలాంటి నెట్‌వర్క్‌ను జంటగా వినిపించవచ్చు, అది వాయిస్‌ను వింటుంది మరియు దానిని టెక్స్ట్‌గా మారుస్తుంది. (ఇది RNN ల యొక్క మరొక అనువర్తనం, ఇప్పుడు అలెక్సా, సిరి, గూగుల్ వాయిస్ మరియు అనేక ఇతర వ్యక్తిగత సహాయకులను శక్తివంతం చేస్తుంది.) కస్టమర్ నుండి ఫోన్ కాల్ వంటి స్వర వ్యక్తీకరణలలో కూడా సెంటిమెంట్‌ను అర్థం చేసుకోవడానికి పరివర్తనం అనువర్తనాన్ని అనుమతిస్తుంది.

ఇది కూడ చూడు

మీ ఫాంటసీ ఫుట్‌బాల్ రోస్టర్‌ను ఎలా పూరించాలికీటో ఫ్లూకెటో డెజర్ట్ రెసిపీకి లక్షణాలు మరియు నివారణలు: క్రీమీ కుకీ డౌ మౌస్కెటో బ్రేక్ ఫాస్ట్ రెసిపీ: అవోకాడో క్లౌడ్ టోస్ట్‌కెటో వన్-పాట్ మీల్ రెసిపీ: క్రిస్పీ కాలేకెటో అపెటిజర్ రెసిపీతో స్టీక్ టెండర్లాయిన్: క్రిస్పీ బేక్డ్ ఉల్లిపాయ రింగ్స్ మరియు బ్రౌట్ వంటకంక్రిప్టోకరెన్సీ మైనింగ్ మరియు వాటా అల్గోరిథంల రుజువుమీ మ్యాక్‌బుక్ గోప్యతను ఎలా రక్షించుకోవాలి: ఐట్యూన్స్ కోసం పున ment స్థాపన చేయండి: మాకోస్ కాటాలినాలో కొత్త సంగీతం మరియు టీవీ అనువర్తనాలు మాకోస్ కాటాలినాతో కొత్తవి ఏమిటి? మాకోస్ కాటాలినాను సెటప్ చేయడానికి శీఘ్ర చిట్కాలు మరియు డమ్మీస్ కోసం మీ మ్యాక్‌బుక్మాక్‌బుక్‌ను నమోదు చేయడానికి మాక్‌బుక్ ఎయిర్ మరియు మాక్‌బుక్ మధ్య మాక్‌బుక్ మధ్య మోసం చేయండి. మీ Windows PC లోని మైక్రోఫోన్‌లోని ఖాతాలు Windows 10 లో ఫైల్ చరిత్ర నుండి ఫైల్‌లను పునరుద్ధరించడం ఎలా మీ Windows 10 PC లో నెట్‌వర్క్ డ్రైవ్‌ను మ్యాప్ చేస్తుందిమీ బ్రేక్ లైన్లను ఎలా తనిఖీ చేయాలి మీ వాహనానికి ట్యూన్ అవసరమా అని చెప్పడానికి ఎలా ఉత్ప్రేరక కన్వర్టర్లను ట్రబుల్షూట్ చేయాలి ఎలా తరచుగా మీ నూనెను ఎలా మార్చాలి? మీ వాహనం యొక్క చమురు స్థాయిని ఎలా తనిఖీ చేయాలి మీ వాహనం యొక్క శీతలీకరణ వ్యవస్థను ఎలా ఫ్లష్ చేయాలి ఇంజిన్హూట్ ఎలా టైర్ మార్చడానికి ఒక స్పార్క్ ప్లగ్‌ను ఎలా ఇన్‌స్టాల్ చేయాలి పాత స్పార్క్ ప్లగ్‌లను తొలగించడం ఎలా డిస్క్ బ్రేక్‌లను ఎలా తనిఖీ చేయాలి మీ బ్రేక్ ఫ్లూయిడ్‌ను ఎలా మార్చాలి మీ బ్రేక్ సిస్టమ్ యొక్క మాస్టర్ సిలిండర్‌ను ఎలా తనిఖీ చేయాలి వాహనం యొక్క బ్రేక్ ఫ్లూయిడ్‌ను ఎలా తనిఖీ చేయాలి నా కారు వేడెక్కడం ఎందుకు మరియు నేను ఏమి చేయగలను? ఎలా సురక్షితంగా జాక్ చేయాలి. మీ వాహనాన్ని మీ బ్రేక్ లైన్లను ఎలా తనిఖీ చేయాలి