ਐ.ਆਈ. ਨੂੰ ਸਮਝਣਾ ਅਤੇ ਕੁਝ ਮੁਖ ਟਰਮਾਨੋਲੋਜੀ

An icon of a key

ਐ.ਆਈ. ਕਈ ਤਕਨੀਕ ਅਤੇ ਟਰਮਾਨੋਲੋਜੀ ਨਾਲ ਆਉਂਦੀ ਹੈ, ਜਿਸ ਵਿੱਚੋਂ ਬਹੁਤ ਸਾਰੀ ਡਾਟਾ ਸਾਇੰਟਿਸਟਾਂ ਤੋਂ ਇਲਾਵਾ ਹੋਰਾਂ ਲਈ ਅਪ੍ਰਤੱਖ ਹੈ। ਚੈਟ ਐ.ਆਈ. ਦੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਐ.ਆਈ. ਦੀ ਟਰਮਾਨੋਲੋਜੀ ਜਾਂ ਸ਼ਾਮਲ ਤਕਨੀਕੀ ਸੰਕਲਪਾਂ ਦਾ ਗਹਿਰਾਈ ਨਾਲ ਗਿਆਨ ਹੋਣ ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ। ਸਿਸਟਮ ਦੀ ਗੱਲਬਾਤ ਵਾਲੀ ਕੁਦਰਤ ਨਾਲ ਤਰਜੀਹੀ ਪਰਸਪਰਕਰਤਾ ਬਿਨਾਂ ਕਿਸੇ ਵਿਸ਼ੇਸ਼ ਪਿਛੋਕੜ ਗਿਆਨ ਦੇ ਸੰਭਵ ਬਣਦੀ ਹੈ ਕਿ ਚੀਜ਼ਾਂ ਕਿਵੇਂ ਕੰਮ ਕਰਦੀਆਂ ਹਨ। ਇਸ ਗੱਲ ’ਤੇ ਧਿਆਨ ਦੇਣਾ ਜ਼ਰੂਰੀ ਹੈ ਕਿ ਚੈਟ ਐ.ਆਈ. ਅਸਲ ਵਿੱਚ ਕੀ ਕਰ ਸਕਦਾ ਹੈ।

ਇਸ ਕਿਤਾਬ ਦੀ ਤਿਆਰੀ ਕਰਦੇ ਸਮੇਂ ਮੈਨੂੰ ਲੜਨਾ ਪਿਆ ਕਿ ਇੱਕ ਲੇਖਕ ਦੇ ਤੌਰ ’ਤੇ ਐ.ਆਈ. ਬਾਰੇ ਕਿਤਾਬ ਦਾ ‘ਜਿੰਮੇਵਾਰ’ ਕੰਮ ਕੀ ਹੈ। ਰਵਾਇਤੀ ਤਰੀਕਾ ਇਹ ਹੈ ਕਿ ਵਿਗਿਆਨ ਦੀ ਇੱਕ ਛੋਟੀ ਵਿਆਖਿਆ ਅਤੇ ਬਾਰ-ਬਾਰ ਵਰਤੀਆਂ ਜਾਣ ਵਾਲੀਆਂ ਸ਼ਰਤਾਂ ਦੀ ਸਮੀਖਿਆ ਪ੍ਰਦਾਨ ਕੀਤੀ ਜਾਵੇ।

ਮੈਂ ਇਹ ਨਹੀਂ ਕਰਨ ਜਾ ਰਿਹਾ।

ਮੈਂ ਇੱਥੇ ਕੁਝ ਬਾਹਰੀ ਲਿੰਕ ਪੇਸ਼ ਕਰਨ ਜਾ ਰਿਹਾ ਹਾਂ ਜੋ ਮੈਂ ਸੋਚਦਾ ਹਾਂ ਕਿ ਐ.ਆਈ. ਬੇਸਿਕਸ ਦੀਆਂ ਕੁਝ ਸਮਝਣ ਯੋਗ ਛੋਟੀਆਂ ਵਰਣਨਾਵਾਂ ਹਨ।

ਐ.ਆਈ. ਦਾ ਭਵਿੱਖ ਕੀ ਹੈ?: ਮੱਕਿੰਸੀ & ਕੋ. (ਅਪ੍ਰੈਲ, 2024) ਨੇ ਵਧੀਆ ਸਮਝਾਇਆ ਹੈ

ਇਸੇ ਤਰ੍ਹਾਂ, Gartner ਦਾ Generative AI (ਮਿਤੀ ਨਹੀਂ ਦਿੱਤੀ ਹੋਈ) ਵੀ ਮਾੜਾ ਨਹੀਂ ਹੈ।

Futurepedia AI Fundamentals (ਮਈ, 2024) ਦਾ ਇਕ ਠੀਕ-ਠਾਕ ਸਾਰ ਦਿੰਦਾ ਹੈ।

ਕਿਵੇਂ-ਕਰਨਾ ਦਾ ਨਿਰਣਾ ਕਰਕੇ, ਹੁਣ ਮੈਂ ਕੁਝ ਸ਼ਬਦਾਂ ਨੂੰ ਪੇਸ਼ ਕਰਨ ਜਾ ਰਿਹਾ ਹਾਂ ਜੋ ਮੈਨੂੰ ਲਗਦਾ ਹੈ ਕਿ ਸਮਝਣ ਲਈ ਕੀਮਤੀ ਹਨ। ਨਾ ਕਿ ਤੁਸੀਂ ਸੌਫਟਵੇਅਰ ਦੀ ਵਰਤੋਂ ਕਰਨ ਲਈ ਇਹਨਾਂ ਨੂੰ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ, ਸਗੋਂ ਕਿ ਇਹ ਸ਼ਬਦ ਮੌਜੂਦਾ ਸੈਣੀ ਦੇ ਏਆਈ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਦੇ ਕੁਝ ਮੁੱਖ ਪਹਲੂਆਂ ਦਾ ਹਵਾਲਾ ਦਿੰਦੇ ਹਨ।

ਮੇਰਾ ਇਸ ਸ਼ਬਦਾਵਲੀ ਅਤੇ ਧਾਰਨਾਵਾਂ ਨਾਲ ਨਿਪਟਣ ਦਾ ਮਾਮਲਾ ਲੇਖਕਾਂ ਅਤੇ ਪ੍ਰਕਾਸ਼ਕਾਂ ਲਈ ਹੈ ਜੋ (i) ਕਿਸੇ ਵੀ ਕਾਰਨ ਕਰਕੇ ਏਆਈ ਦੇ ਮਾਮਲੇ ਵਿੱਚ ਇੱਕ ਪੱਧਰ ਗਹਿਰਾ ਜਾਣਾ ਚਾਹੁੰਦੇ ਹਨ, ਜਾਂ (ii) ਮੌਜੂਦਾ ਏਆਈ ਦੀਆਂ ਆਲੋਚਨਾਵਾਂ ਦੇ ਸੰਦਰਭ ਨੂੰ ਸਮਝਣਾ ਚਾਹੁੰਦੇ ਹਨ, ਜਾਂ (iii) ਇਸ ਬਾਰੇ ਰਣਨੀਤਿਕ ਚਰਚਾਵਾਂ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਣਾ ਚਾਹੁੰਦੇ ਹਨ ਕਿ ਉਹਨਾਂ ਦੇ ਸਾਥੀਆਂ ਜਾਂ ਸੰਗਠਨਾਂ ਨੂੰ ਏਆਈ ਨੂੰ ਕਿਵੇਂ ਸਾਂਭਣਾ ਚਾਹੀਦਾ ਹੈ।

ਅੰਫ਼ਰ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਇਹ ਉਹ ਨਹੀਂ ਹੈ ਜੋ ਤੁਹਾਨੂੰ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ, ਬਲਕਿ, ਜੋ ਤੁਸੀਂ ਜਾਣਨਾ ਚਾਹੁਣਗੇ। ਇੱਥੇ ਹਨ, ਗੈਰ-ਵਰਨਮਾਲਾ ਲੜੀ ਵਿੱਚ:

ਪ੍ਰੋੰਪਟਸ ਅਤੇ ਪ੍ਰੋੰਪਟਿੰਗ

ਤੁਸੀਂ ਚੈਟ ਏਆਈ ਸੌਫਟਵੇਅਰ ਖੋਲ੍ਹ ਸਕਦੇ ਹੋ ਅਤੇ ਬਸ ਇੱਕ ਸਵਾਲ ਟਾਈਪ ਕਰ ਸਕਦੇ ਹੋ, ਬਿਲਕੁਲ ਜਿਵੇਂ ਤੁਸੀਂ ਮੌਜੂਦਾ Google ’ਤੇ ਕਰਦੇ ਹੋ।

ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ (ਐੱਲਐਲਐਮ)

ਵੱਡੇ ਭਾਸ਼ਾ ਮਾਡਲ ਬਹੁਤ ਸਾਰਾ (ਜ਼ਿਆਦਾਤਰ) ਲਿਖਤ ਸਮੱਗਰੀ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਕੇ ਕੰਮ ਕਰਦੇ ਹਨ, ਜੋ ਉਹਨਾਂ ਨੂੰ ਅਗਲੇ ਗੱਲਬਾਤ ਜਾਂ ਲਿਖਤ ਦੇ ਟੁਕੜੇ ਵਿੱਚ ਕਿਹੜੇ ਸ਼ਬਦ ਜਾਂ ਵਾਕ ਆਉਣਗੇ, ਦੀ ਪੇਸ਼ਗੋਈ ਕਰਨ ਦੀ ਆਗਿਆ ਦਿੰਦੇ ਹਨ। ਉਹ ਮਨੁੱਖੀ ਅਰਥ ਵਿੱਚ ਭਾਸ਼ਾ ਨੂੰ ‘ਸਮਝਦੇ’ ਨਹੀਂ ਹਨ, ਸਗੋਂ ਪਾਠ ਨੂੰ ਛੋਟੇ ਟੁਕੜੇ (ਜਿਨ੍ਹਾਂ ਨੂੰ ਟੋਕਨ ਕਿਹਾ ਜਾਂਦਾ ਹੈ) ਵਿੱਚ ਤੋੜ ਕੇ, ਅਤੇ ਫਿਰ ਟੋਕਨਾਂ ਨੂੰ ਨੰਬਰਾਂ ਵਿੱਚ ਬਦਲ ਕੇ ਪ੍ਰਕਿਰਿਆ ਕਰਦੇ ਹਨ। ਉਹ ਪਾਠ ਨੂੰ ਨੰਬਰਾਂ ਵਜੋਂ ਪ੍ਰਕਿਰਿਆ ਕਰਦੇ ਹਨ, ਹੋਰ ਨੰਬਰਾਂ ਨੂੰ ਵਾਪਸ ਕਰਦੇ ਹਨ, ਜੋ ਫਿਰ ਆਉਟਪੁੱਟ ’ਤੇ ਪਾਠ ਵਿੱਚ ਬਦਲ ਜਾਂਦੇ ਹਨ। ਇਹ ਚੈਟ ਏਆਈ ’ਚ ਕਾਪੀਰਾਈਟ ਕੀਤੇ ਕੰਮ ਨਹੀਂ ‘ਸ਼ਾਮਲ’ ਕਰਨ ਦਾ ਇੱਕ ਬਹੁਤ ਹੀ ਸਧਾਰਨ ਵਰਣਨ ਹੈ: ਇਹ ਉਨ੍ਹਾਂ ਅਧਾਰਕ ਪਾਠਾਂ ਤੋਂ ਬਹੁਤ ਵੱਡੀ ਅਭਿਧਾਰਨਾ ਦਾ ਪ੍ਰਤੀਨਿਧਿਤਾ ਕਰਨ ਵਾਲੇ ਨੰਬਰਾਂ ਨਾਲ ਬਣਿਆ ਹੈ।

ਐੱਲਐਲਐਮ ਸਿਖਲਾਈ ਜਾਂਦੇ ਹਨ ਕਿ ਭਾਸ਼ਾ ਆਮ ਤੌਰ ਤੇ ਕਿਵੇਂ ਵਰਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ ਫਿਰ ਇਸ ਸਮਝ ਦੇ ਅਧਾਰ ਤੇ ਜਵਾਬ ਪੈਦਾ ਕਰਦੇ ਹਨ। ਅਸੀਂ ਅਕਸਰ ਇਹ ਅਨੁਮਾਨਾ ਲਗਾ ਲੈਂਦੇ ਹਾਂ ਕਿ ਜ਼ਿਆਦਾਤਰ ਭਾਸ਼ਾ ਕਿੰਨੀ ਪੇਸ਼ਗੋਈਯੋਗ ਹੈ। ਚੈਟ ਏਆਈ ਲਿਖਤ ਪੈਦਾ ਕਰ ਸਕਦਾ ਹੈ ਜੋ (ਕਈ ਵਾਰ ਹੈਰਾਨੀਜਨਕ ਤੌਰ ਤੇ) ਮੌਜੂਦਾ ਸਾਹਿਤ ਨਾਲ ਮਿਲਦਾ ਹੈ, ਪਰ, ਡਿਜ਼ਾਇਨ ਦੁਆਰਾ, ਇਸ ਵਿੱਚ ਨਿਰਧਾਰਿਤ ਅੰਸ਼ਾਂ ਜਾਂ ਕਾਪੀਰਾਈਟ ਕੀਤੇ ਪਾਠਾਂ ਦੀਆਂ ਨਕਲਾਂ ਨੂੰ ਪ੍ਰਾਪਤ ਕਰਨ ਦੀ ਸਮਰਥਾ ਨਹੀਂ ਹੁੰਦੀ। (ਮੈਨੂੰ ਪਤਾ ਹੈ, ਤੁਹਾਨੂੰ ਬਹੁਤ ਸਾਰੇ ਲੋਕਾਂ ਨੇ New York Times ਦੇ OpenAI ਦੇ ਖ਼ਿਲਾਫ਼ ਮੁਕੱਦਮੇ ਬਾਰੇ ਸੁਣਾਇਆ ਹੈ—Times ਚੈਟਜੀਪੀਟੀ ਨੂੰ ਕੁਝ ਪਹਿਲਾਂ ਪ੍ਰਕਾਸ਼ਿਤ ਲੇਖਾਂ ਦੇ ਹਿੱਸਿਆਂ ਨੂੰ ਜਿਵੇਂ ਦੇ ਤਿਵੇਂ ਵਾਪਸ ਕਰਨ ਲਈ ਪ੍ਰਾਪਤ ਕਰਨ ਵਿੱਚ ਸਮਰੱਥ ਸੀ।

ਜਨਰੇਟਿਵ ਏਆਈ

ਇਸ ਸ਼ਬਦ ਨੂੰ ਸਮਝਣ ਲਈ ਸਭ ਤੋਂ ਜ਼ਰੂਰੀ ਗੱਲ “ਜਨਰੇਟਿਵ” ਭਾਗ ਹੈ। ਜਨਰੇਟਿਵ ਏਆਈ ਨਵਾਂ ਪਾਠ ਜਨਰੇਟ ਕਰਦਾ ਹੈ।

ਜਨਰੇਟਿਵ ਪ੍ਰੀ-ਟ੍ਰੇਂਡ ਟ੍ਰਾਂਸਫਾਰਮਰ (ਜੀਪੀਟੀ)

ਇਹ, ਇੱਥੇ ਦੀ ਸਬ ਤੋਂ ਗਹਿਰੀ ਟਰਮਿਨੋਲੋਜੀ ਹੈ, ਜੋ ਕਿ OpenAI ਦੁਆਰਾ ਵਿਕਸਿਤ ਕੀਤੇ ਗਏ ਇੱਕ ਖਾਸ ਕਿਸਮ ਦੇ LLM ਦੀ ਵਰਣਨਾ ਕਰਦਾ ਹੈ। “ਜਨਰੇਟਿਵ” ਇਸ ਦੀ ਪਾਠ ਬਣਾਉਣ ਦੀ ਸਮਰੱਥਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ, “ਪ੍ਰੀ-ਟ੍ਰੇਂਡ” ਇਸ ਗੱਲ ਦਾ ਸੰਕੇਤ ਹੈ ਕਿ ਇਸ ਨੂੰ ਵੱਡੇ ਪਾਠ ਡੇਟਾ ਦੇ ਸੰਗ੍ਰਹਿ ’ਤੇ ਸਿਖਲਾਇਆ ਗਿਆ ਹੈ, ਅਤੇ “ਟ੍ਰਾਂਸਫਾਰਮਰ” ਉਸ ਸੌਫਟਵੇਅਰ ਦੀ ਭੂਮਿਕਾ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜਿਹੜਾ ਇਹ ਵਰਤਦਾ ਹੈ। ਕੀ ਜੀਪੀਟੀ ਲਈ ਕੀ ਖੜਾ ਹੈ ਇਹ ਜਾਣਨਾ ਸਿਰਫ ਇਸ ਲਈ ਮਦਦਗਾਰ ਹੈ ਕਿ ਤੁਸੀਂ ਸਮਝ ਸਕੋ ਕਿ ਚੈਟਜੀਪੀਟੀ ਵਿੱਚ ਜੀਪੀਟੀ ਕੀ ਹੈ।

ਚੈਟਜੀਪੀਟੀ

ਚੈਟਜੀਪੀਟੀ ਉਹ ਸੌਫਟਵੇਅਰ ਹੈ ਜੋ ਤੁਸੀਂ ਵੇਖਦੇ ਹੋ; ਜੀਪੀਟੀ ਉਹ ਹੈ ਜੋ ਸੌਫਟਵੇਅਰ ਦੇ ਪਿੱਛੇ ਹੈ। ਉਪਭੋਗਤਾ ਚੈਟਜੀਪੀਟੀ ਦਾ ਅਨੁਭਵ ਕਰਦੇ ਹਨ, ਜੀਪੀਟੀ ਦਾ ਨਹੀਂ। ਜਿਵੇਂ ਕਿ ਉਪਰ ਦਿੱਤਾ ਗਿਆ ਹੈ, ਚੈਟਜੀਪੀਟੀ ਕਈ ਚੈਟ ਏਆਈ ਆਨਲਾਈਨ ਸੌਫਟਵੇਅਰ ਸਿਸਟਮਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ, ਜਿਸ ਦੀ ਫੰਕਸ਼ਨਲਿਟੀ ਸਮਾਨ ਹੈ।

ਇੱਕ ਹੋਰ ਸ਼ਬਦ ਜੋ ਤੁਹਾਡੇ ਲਈ ਅਕਸਰ ਜਾਣੂ ਨਹੀਂ ਹੁੰਦਾ, ਉਹ ਹੈ:

ਕੋਰਪਸ

ਸ਼ਬਦਕੋਸ਼ ਦੇ ਅਨੁਸਾਰ ਕੋਰਪਸ ਦਾ ਅਰਥ ਹੈ “ਲਿਖੇ ਪਾਠਾਂ ਦਾ ਸੰਗ੍ਰਹਿ” (ਹਾਲਾਂਕਿ, ਅਸਲ ਵਿੱਚ, ਇਹ ਹਮੇਸ਼ਾਂ ਪਾਠ ਨਹੀਂ ਹੁੰਦਾ)। ਇਹ ਸ਼ਬਦ ਇਸ ਸੰਦਰਭ ਵਿੱਚ ਵਰਤਿਆ ਜਾਂਦਾ ਹੈ ਜਿਸ ’ਤੇ ਜੀਪੀਟੀ ਸਿਖਲਾਈ ਜਾਂਦੇ ਹਨ: ਵੱਡੇ ਕੋਰਪਸਾਂ ਦੇ (ਜ਼ਿਆਦਾਤਰ) ਪਾਠ। ਸਾਨੂੰ ਦੱਸਿਆ ਗਿਆ ਹੈ ਕਿ ਸਭ ਤੋਂ ਵੱਡੇ ਕੋਰਪਸ ਵਿੱਚ ਸੈਂਕੜੇ ਅਰਬ ਸ਼ਬਦ ਹਨ। ਆਮ ਲੋਕਾਂ ਲਈ ਇਹ ਸਮਝਣਾ ਅਸੰਭਵ ਹੈ। ਕੀ ਤੁਸੀਂ ਵਿਕੀਪੀਡੀਆ ਨੂੰ ਵੱਡਾ ਨਹੀਂ ਸੋਚਦੇ, ਜੋ ਕਿ ਬਹੁਤ ਸਾਰੇ ਸ਼ਬਦਾਂ ਨੂੰ ਸ਼ਾਮਲ ਕਰਦਾ ਹੈ? ਖੈਰ, ਵਿਕੀਪੀਡੀਆ ਵਿੱਚ ਸਿਰਫ 4.5 ਬਿਲੀਅਨ ਸ਼ਬਦ ਹਨ—ਜੀਪੀਟੀ-4 ਨੂੰ ਇੱਕ ਟ੍ਰਿਲੀਅਨ ਤੋਂ ਵੀ ਵੱਧ ਸਿਖਲਾਇਆ ਗਿਆ ਸੀ।

ਮੈਂ ਸੋਚਦਾ ਹਾਂ ਕਿ ਇਸ ਪੈਮਾਨੇ ਨੂੰ ਵਿਚਾਰਣਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਲੇਖਕ, ਸਮਝਦਾਰੀ ਨਾਲ, ਚਿੰਤਤ ਹਨ ਕਿ ਉਹਨਾਂ ਦੀ ਕਿਤਾਬ ਵਿੱਚ 75,000 ਸ਼ਬਦ, ਪਲੱਸ ਜਾਂ ਮਾਈਨਸ, ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲ ਵਿੱਚ ਚੂਸੇ ਗਏ ਹੋ ਸਕਦੇ ਹਨ। ਸ਼ਾਇਦ ਉਹ (ਹੇਠਾਂ ਵਧੇਰੇ)। ਪਰ ਜੇਕਰ ਇਹ ਮਾਮਲਾ ਹੈ, ਤਾਂ ਸੋਚੋ ਕਿ ਅੱਜ ਦੇ ਵੱਡੇ ਭਾਸ਼ਾਈ ਮਾਡਲਾਂ ਦੀ ਕੁੱਲ ਤਾਕਤ ਦੇ ਮੁਕਾਬਲੇ ਕਿਸੇ ਵੀ ਇੱਕ ਕਿਤਾਬ ਦੀ ਕਿੰਨੀ ਘੱਟ ਕਦਰ ਹੈ। ਇਹ ਸੱਚਮੁੱਚ ਅਹਿਮ ਨਹੀਂ ਹੈ। ਅਹਿਮ ਤੋਂ ਬਾਹਰ। ਇੱਥੇ ਤੱਕ ਕਿ 10,000 ਕਿਤਾਬਾਂ ਵੀ ਬਹੁਤ ਘੱਟ ਹਨ।